商品簡介
作者簡介
名人/編輯推薦
目次
第1章 大數據理論 2
1.1 大數據的概念 2
1.1.1 大數據的定義 2
1.1.2 大數據的本質 2
1.1.3 大數據的分類 3
1.1.4 大數據的特徵 5
1.1.5 大數據的功能 6
1.1.6 大數據處理的基本流程 6
1.2 大數據的發展 7
1.2.1 大數據的發展現狀 7
1.2.2 大數據的發展趨勢 7
1.3 大數據的應用 8
1.3.1 企業內部大數據 8
1.3.2 在線社交網絡大數據 8
1.3.3 健康醫療大數據 9
1.3.4 金融大數據 9
1.4 常用的數據挖掘工具 10
1.4.1 Tableau 10
1.4.2 Excel 10
1.4.3 SPSS Modeler 11
數據分析與挖掘模塊
第2章 SPSS Modeler軟件 14
2.1 SPSS Modeler 軟件概述 14
2.1.1 SPSS Modeler界面 14
2.1.2 數據流的基本管理和執行 16
2.1.3 數據流的其他管理 18
2.1.4 SPSS Modeler應用案例 20
2.2SPSS Modeler數據的讀入 25
2.2.1 變量的類型 25
2.2.2 讀數據 26
2.2.3 生成實驗方案數據 32
2.2.4 數據合併 34
2.3 SPSS Modeler數據的基本分析 38
2.3.1 數據質量 38
2.3.2 基本描述分析 44
2.3.3 變量分佈探索 47
2.3.4 二分類型變量相關性研究 49
2.3.5 兩總體的平均值比較 56
2.3.6 變量的重要性分析 62
第3章 數據清洗 67
3.1 數據清洗概述 67
3.1.1 數據清洗的概念 67
3.1.2 數據清洗的對象 67
3.1.3 數據清洗的一般步驟 68
3.1.4 數據清洗的常用方式 69
3.1.5 數據清洗的基本方法 69
3.2 Excel數據清洗的基本操作 70
3.2.1 重複值的處理 70
3.2.2 缺失值及異常值的處理 74
3.3 Excel數據加工的基本操作 78
3.3.1 字段分列 78
3.3.2 字段合併 79
3.3.3 字段匹配 80
3.3.4 數據分組 81
3.4 Excel數據透視表 81
3.4.1 數據透視表應用 81
3.4.2 數據透視表的實用技巧 85
第4章 時間序列分析 89
4.1 時間序列 89
4.1.1 時間序列概述 89
4.1.2 時間序列的預測步驟 90
4.2 移動平均法 90
4.2.1 一次移動平均法 91
4.2.2 二次移動平均法 94
4.3 指數平滑法 96
4.3.1 一次指數平滑法 97
4.3.2 二次指數平滑法 98
4.3.3 三次指數平滑法 104
第5章 分類預測:決策樹 110
5.1 決策樹概述 110
5.1.1 什麼是決策樹 110
5.1.2 決策樹的幾何理解 111
5.1.3 決策樹的核心問題 111
5.2 SPSS Modeler中的C5.0算法及應用 113
5.2.1 C5.0決策樹的分割點 113
5.2.2 C5.0決策樹的剪枝過程 114
5.2.3 C5.0決策樹的推理規則集 115
5.2.4 C5.0決策樹的應用 116
5.3 SPSS Modeler中的C&RT算法及應用 123
5.3.1 C&RT的生長過程 124
5.3.2 C&RT的剪枝過程 125
5.3.3 C&RT的應用 127
5.4 SPSS Modeler中的CHAID算法及應用 129
5.4.1 CHAID算法的最佳分組變量 130
5.4.2 CHAID算法的剪枝過程 130
5.4.3 Exhaustive CHAID算法 131
5.4.4 CHAID算法的應用 131
5.5 SPSS Modeler中的QUEST算法及應用 132
5.5.1 QUEST算法的最佳分割點 132
5.5.2 QUEST算法的應用 133
5.6 決策樹算法的評估和注意事項 134
第6章 分類預測:人工神經網絡 143
6.1 人工神經網絡概述 143
6.1.1 人工神經網絡的概念和種類 143
6.1.2 人工神經網絡中的節點 145
6.1.3 建立人工神經網絡的一般步驟 147
6.2 SPSS Modeler中的B-P反向傳播網絡 149
6.2.1 感知器模型 149
6.2.2 B-P反向傳播網絡 152
6.2.3 B-P反向傳播算法 154
6.2.4 B-P反向傳播網絡的建立 156
6.3 SPSS Modeler中的徑向基函數網絡 159
6.3.1 徑向基函數網絡 159
6.3.2 徑向基函數網絡中的隱藏層節點和輸出節點 160
6.3.3 徑向基函數網絡的學習過程 161
6.4 人工神經網絡的應用 162
第7章 分類預測:Logistic回歸分析 176
7.1 二項Logistic回歸方程 176
7.1.1 二項Logistic回歸方程概述 176
7.1.2 二項Logistic回歸方程中係數的含義 178
7.2 二項Logistic回歸分析的應用 180
7.3 多項Logistic回歸分析的應用 184
第8章 關聯分析 185
8.1 簡單關聯規則分析 185
8.1.1 簡單關聯規則的基本概念 186
8.1.2 簡單關聯規則的有效性和實用性 187
8.2 Apriori算法 190
8.2.1 尋找頻繁項集 190
8.2.2 依據頻繁項集產生簡單關聯規則 192
8.3 Apriori算法的應用 193
8.4 序列關聯規則分析 200
8.4.1 序列關聯規則的基本概念 200
8.4.2 序列關聯規則的時間約束 201
8.5 Sequence算法 202
8.5.1 產生頻繁序列集 202
8.5.2 依據頻繁序列集生成序列關聯規則 203
8.6 Sequence算法的應用 204
第9章 聚類分析 208
9.1 聚類分析概述 208
9.2 K-Means聚類算法及應用 209
9.2.1 K-Means聚類算法對“親疏程度”的衡量 209
9.2.2 K-Means聚類過程 209
9.2.3 K-Means聚類算法的應用 211
9.3 兩步聚類算法及應用 219
9.3.1 兩步聚類算法對“親疏程度”的衡量 219
9.3.2 兩步聚類過程 220
9.3.3 兩步聚類算法的應用 222
9.4 Kohonen網絡聚類算法及應用 224
9.4.1 Kohonen網絡聚類算法的原理 224
9.4.2 Kohonen網絡聚類過程 225
9.4.3 Kohonen網絡聚類算法的應用 227
9.5 基於聚類分析的離群值探索及應用 230
9.5.1 多維空間基於聚類的診斷方法 230
9.5.2 多維空間基於聚類的診斷方法的應用 232
數據可視化模塊
第10章 數據可視化 238
10.1 數據可視化入門 238
10.1.1 i2 Analyst's Notebook 8軟件 238
10.1.2 基本概念 239
10.1.3 數據接口 243
10.2 基本功能 243
10.2.1 基本操作 243
10.2.2 搜索查找 245
10.3 功能演練 248
10.3.1 話單關係分析 248
10.3.2 人員物品動態關係 255
10.3.3 銀行賬戶交易分析 259
10.3.4 話單ABC分析 266
10.3.5 盜竊案旅業分析 272
10.3.6 人員活動軌跡 275
主題書展
更多主題書展
更多書展本週66折
您曾經瀏覽過的商品
購物須知
大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。
特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。
無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。
為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。
若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。