大數據應用基礎-分類算法(PPT 115頁)
主要內容
分類算法
大數據複習
大數據的核心是什麼
大數據的核心——非結構化數據
大數據架構技術的核心
大數據技術中的算法
數據挖掘的概念辨析
數據挖掘的基本流程
數據挖掘算法分類
高度重視以下同義詞
數據準備的重要性
分類模型的評價
分類的步驟——數據集的劃分
分類的步驟——模型的訓練與使用
分類的步驟
複習到此結束
分類算法的核心概念辨析
按目標變量類型把監督學習分為兩類
注意回歸這一概念的歧義
有監督學習與預測的區別
二分類和多分類
分類算法的典型應用
分類算法的應用——銷售
分類算法的應用——金融
保險索賠的欺詐檢測
分類算法的應用——電信
分類算法的應用——機電設備
分類算法的應用——溝通交流
分類算法的應用
對分類算法的常見應用的小結
常見分類算法
決策樹
決策樹的剪枝
決策樹的用途
決策樹的優缺點
決策樹的例子——是否去相親
決策樹的例子——判斷性別
決策樹例子——是否參加戰鬥
決策樹的其他例子
邏輯回歸
邏輯回歸的步驟
邏輯回歸模型的檢驗
決策樹和邏輯回歸的比較
支持向量機
支持向量機的原理
支持向量機——選最大邊際的那個超平麵
支持向量機的一個特點
支持向量機的優缺點
支持向量機的應用
支持向量機關鍵概念小結
在SPSS Modeler中使用SVM
KNN 算法
KNN 算法的最大特點
在SPSS Modeler中使用KNN 算法
樸素貝葉斯分類
樸素貝葉斯分類的步驟
樸素貝葉斯分類的原理
具體公式
為什麼獨立性假設是可行的?
樸素貝葉斯學習的應用
貝葉斯網絡
組合方法
組合方法的種類
組合方法——提升算法
組合方法——袋裝
組合方法——隨機森林
組合方法——隨機森林的步驟
組合方法——隨機森林的優點
組合方法的優點
人工神經網絡
人工神經網絡的缺點
人工神經網絡的優點
人工神經網絡中的函數
人工神經網絡的訓練算法
人工神經網絡的常用訓練算法——後向傳播算法
人工神經網絡的結構
人工神經網絡的常用結構——多層感知器
人工神經網絡的應用
深度學習
深度學習基本原理
基本原理
深度學習在業界的代表性應用
百度的深度識別應用——百度輕拍
如何在R和SPSS上使用神經網絡算法
先要做數據預處理
如何在R上使用神經網絡算法
如何在SPSS上使用神經網絡算法
隆重推薦幾本書
如何用簡單工具實現數據挖掘
如果你想實現更多大數據功能
要點小結
訓練和預測過程回顧
..............................