商品簡介
名人/編輯推薦
目次
相關商品
商品簡介
大數據分析與機器學習技術已成為各行各業實現數字化變革的關鍵驅動力。本書以功能強大且較易上手的Python語言為編程環境,全面講解了大數據分析與機器學習技術的商業應用實戰。
全書共16章,講解了線性回歸模型、邏輯回歸模型、決策樹模型、樸素貝葉斯模型、K近鄰算法模型、隨機森林模型、AdaBoost與GBDT模型、XGBoost與LightGBM模型、PCA(主成分分析)模型、聚類與分群模型(KMeans與DBSCAN算法)、協同過濾算法模型、Apriori關聯分析模型、神經網絡模型等十餘種機器學習模型的原理和代碼實現,每種模型都配有一到兩個典型案例,涵蓋金融、營銷、醫療、社會科學、企業辦公與管理等多個領域。
本書適合具備一定數學知識和編程基礎、希望快速在工作中應用大數據分析與機器學習技術的讀者閱讀,也適合Python編程愛好者或對大數據分析與機器學習技術感興趣的讀者參考。
全書共16章,講解了線性回歸模型、邏輯回歸模型、決策樹模型、樸素貝葉斯模型、K近鄰算法模型、隨機森林模型、AdaBoost與GBDT模型、XGBoost與LightGBM模型、PCA(主成分分析)模型、聚類與分群模型(KMeans與DBSCAN算法)、協同過濾算法模型、Apriori關聯分析模型、神經網絡模型等十餘種機器學習模型的原理和代碼實現,每種模型都配有一到兩個典型案例,涵蓋金融、營銷、醫療、社會科學、企業辦公與管理等多個領域。
本書適合具備一定數學知識和編程基礎、希望快速在工作中應用大數據分析與機器學習技術的讀者閱讀,也適合Python編程愛好者或對大數據分析與機器學習技術感興趣的讀者參考。
名人/編輯推薦
零基礎學機器學習與量化策略、全面揭秘機器學習在商業中的應用實戰,詳細金融數據風控、股票量化交易等分析
目次
前言
如何獲取學習資源
第1章 Python與數據科學
1.1 大數據分析與機器學習概述13
1.1.1 大數據分析與機器學習的應用領域13
1.1.2 機器學習的基本概念14
1.1.3 Python在數據科學中的作用16
1.2 Python編程環境部署與基本操作16
1.2.1 Python的安裝16
1.2.2 Pycharm的安裝與設置18
1.2.3 Jupyter Notebook的使用22
1.3 Python基礎知識概要28
第2章 數據分析利器:NumPy、pandas與Matplotlib庫
2.1 NumPy庫基礎29
2.1.1 NumPy庫與數組29
2.1.2 數組與列表的區別30
2.1.3 創建數組的幾種方式31
2.2 pandas庫基礎33
2.2.1 二維數據表格DataFrame的創建33
2.2.2 Excel工作簿等文件的讀取和寫入38
2.2.3 數據的選取與處理41
2.2.4 數據表拼接47
2.3 Matplotlib庫基礎51
2.3.1 基本圖表繪製51
2.3.2 數據可視化常用技巧56
2.4 案例實戰:股票數據讀取與K線圖繪製61
2.4.1 初步嘗試:股票數據讀取與可視化62
2.4.2 進階實戰:股票K線圖繪製65
第3章 線性回歸模型
3.1 一元線性回歸73
3.1.1 一元線性回歸的數學原理73
3.1.2 一元線性回歸的代碼實現75
3.1.3 案例實戰:不同行業工齡與薪水的線性回歸模型77
3.2 線性回歸模型評估83
3.2.1 模型評估的編程實現83
3.2.2 模型評估的數學原理84
3.3 多元線性回歸87
3.3.1 多元線性回歸的數學原理和代碼實現87
3.3.2 案例實戰:客戶價值預測模型88
第4章 邏輯回歸模型
4.1 邏輯回歸模型的算法原理92
4.1.1 邏輯回歸模型的數學原理92
4.1.2 邏輯回歸模型的代碼實現94
4.1.3 邏輯回歸模型的深入理解95
4.2 案例實戰:客戶流失預警模型98
4.2.1 案例背景98
4.2.2 數據讀取與變量劃分98
4.2.3 模型的搭建與使用99
4.3 模型評估方法:ROC曲線與KS曲線104
4.3.1 ROC曲線的基本原理105
4.3.2 案例實戰:用ROC曲線評估客戶流失預警模型108
4.3.3 KS曲線的基本原理111
4.3.4 案例實戰:用KS曲線評估客戶流失預警模型112
第5章 決策樹模型
5.1 決策樹模型的基本原理115
5.1.1 決策樹模型簡介115
5.1.2 決策樹模型的建樹依據116
5.1.3 決策樹模型的代碼實現119
5.2 案例實戰:員工離職預測模型123
5.2.1 模型搭建123
5.2.2 模型預測及評估126
5.2.3 決策樹模型可視化呈現及決策樹要點理解131
5.3 參數調優:K折交叉驗證與GridSearch網格搜索138
5.3.1 K折交叉驗證138
5.3.2 GridSearch網格搜索139
第6章 樸素貝葉斯模型
6.1 樸素貝葉斯模型的算法原理145
6.1.1 一維特徵變量下的貝葉斯模型145
6.1.2 二維特徵變量下的貝葉斯模型146
6.1.3 n維特徵變量下的貝葉斯模型147
6.1.4 樸素貝葉斯模型的簡單代碼實現147
6.2 案例實戰:腫瘤預測模型148
6.2.1 案例背景148
6.2.2 數據讀取與劃分148
6.2.3 模型的搭建與使用149
第7章 K近鄰算法
7.1 K近鄰算法的原理和代碼實現152
7.1.1 K近鄰算法的基本原理152
7.1.2 K近鄰算法的計算步驟153
7.1.3 K近鄰算法的代碼實現155
7.2 案例實戰:手寫數字識別模型157
7.2.1 案例背景157
7.2.2 手寫數字識別的原理157
7.2.3 手寫數字識別的代碼實現159
7.3 圖像識別原理詳解162
第8章 隨機森林模型
8.1 隨機森林模型的原理和代碼實現166
8.1.1 集成模型簡介166
8.1.2 隨機森林模型的基本原理167
8.1.3 隨機森林模型的代碼實現168
8.2 案例實戰:股票漲跌預測模型170
8.2.1 股票基本數據獲取170
8.2.2 股票衍生變量生成173
8.2.3 多因子模型搭建181
8.2.4 模型使用與評估184
8.2.5 參數調優186
8.2.6 收益回測曲線繪製188
第9章 AdaBoost與GBDT模型
9.1 AdaBoost算法原理190
9.1.1 AdaBoost算法的核心思想190
9.1.2 AdaBoost算法的數學原理概述191
9.1.3 AdaBoost算法的數學原理舉例194
9.1.4 AdaBoost算法的簡單代碼實現200
9.2 AdaBoost算法案例實戰:信用卡精准營銷模型201
9.2.1 案例背景201
9.2.2 模型搭建201
9.2.3 模型預測及評估202
9.2.4 模型參數介紹205
9.3 GBDT算法原理206
9.3.1 GBDT算法的核心思想206
9.3.2 GBDT算法的數學原理概述208
9.3.3 GBDT算法的數學原理舉例208
9.3.4 GBDT算法的簡單代碼實現213
9.4 GBDT算法案例實戰:產品定價模型214
9.4.1 案例背景214
9.4.2 模型搭建214
9.4.3 模型預測及評估217
9.4.4 模型參數介紹219
第10章 機器學習神器:XGBoost與LightGBM算法
10.1 XGBoost算法原理223
10.1.1 XGBoost算法的核心思想224
10.1.2 XGBoost算法的數學原理概述224
10.1.3 XGBoost算法的簡單代碼實現225
10.2 XGBoost算法案例實戰1:金融反欺詐模型226
10.2.1 案例背景226
10.2.2 模型搭建226
10.2.3 模型預測及評估228
10.2.4 模型參數調優230
10.3 XGBoost算法案例實戰2:信用評分卡模型233
10.3.1 案例背景233
10.3.2 多元線性回歸模型234
10.3.3 GBDT回歸模型235
10.3.4 XGBoost回歸模型237
10.4 LightGBM算法原理241
10.4.1 LightGBM
如何獲取學習資源
第1章 Python與數據科學
1.1 大數據分析與機器學習概述13
1.1.1 大數據分析與機器學習的應用領域13
1.1.2 機器學習的基本概念14
1.1.3 Python在數據科學中的作用16
1.2 Python編程環境部署與基本操作16
1.2.1 Python的安裝16
1.2.2 Pycharm的安裝與設置18
1.2.3 Jupyter Notebook的使用22
1.3 Python基礎知識概要28
第2章 數據分析利器:NumPy、pandas與Matplotlib庫
2.1 NumPy庫基礎29
2.1.1 NumPy庫與數組29
2.1.2 數組與列表的區別30
2.1.3 創建數組的幾種方式31
2.2 pandas庫基礎33
2.2.1 二維數據表格DataFrame的創建33
2.2.2 Excel工作簿等文件的讀取和寫入38
2.2.3 數據的選取與處理41
2.2.4 數據表拼接47
2.3 Matplotlib庫基礎51
2.3.1 基本圖表繪製51
2.3.2 數據可視化常用技巧56
2.4 案例實戰:股票數據讀取與K線圖繪製61
2.4.1 初步嘗試:股票數據讀取與可視化62
2.4.2 進階實戰:股票K線圖繪製65
第3章 線性回歸模型
3.1 一元線性回歸73
3.1.1 一元線性回歸的數學原理73
3.1.2 一元線性回歸的代碼實現75
3.1.3 案例實戰:不同行業工齡與薪水的線性回歸模型77
3.2 線性回歸模型評估83
3.2.1 模型評估的編程實現83
3.2.2 模型評估的數學原理84
3.3 多元線性回歸87
3.3.1 多元線性回歸的數學原理和代碼實現87
3.3.2 案例實戰:客戶價值預測模型88
第4章 邏輯回歸模型
4.1 邏輯回歸模型的算法原理92
4.1.1 邏輯回歸模型的數學原理92
4.1.2 邏輯回歸模型的代碼實現94
4.1.3 邏輯回歸模型的深入理解95
4.2 案例實戰:客戶流失預警模型98
4.2.1 案例背景98
4.2.2 數據讀取與變量劃分98
4.2.3 模型的搭建與使用99
4.3 模型評估方法:ROC曲線與KS曲線104
4.3.1 ROC曲線的基本原理105
4.3.2 案例實戰:用ROC曲線評估客戶流失預警模型108
4.3.3 KS曲線的基本原理111
4.3.4 案例實戰:用KS曲線評估客戶流失預警模型112
第5章 決策樹模型
5.1 決策樹模型的基本原理115
5.1.1 決策樹模型簡介115
5.1.2 決策樹模型的建樹依據116
5.1.3 決策樹模型的代碼實現119
5.2 案例實戰:員工離職預測模型123
5.2.1 模型搭建123
5.2.2 模型預測及評估126
5.2.3 決策樹模型可視化呈現及決策樹要點理解131
5.3 參數調優:K折交叉驗證與GridSearch網格搜索138
5.3.1 K折交叉驗證138
5.3.2 GridSearch網格搜索139
第6章 樸素貝葉斯模型
6.1 樸素貝葉斯模型的算法原理145
6.1.1 一維特徵變量下的貝葉斯模型145
6.1.2 二維特徵變量下的貝葉斯模型146
6.1.3 n維特徵變量下的貝葉斯模型147
6.1.4 樸素貝葉斯模型的簡單代碼實現147
6.2 案例實戰:腫瘤預測模型148
6.2.1 案例背景148
6.2.2 數據讀取與劃分148
6.2.3 模型的搭建與使用149
第7章 K近鄰算法
7.1 K近鄰算法的原理和代碼實現152
7.1.1 K近鄰算法的基本原理152
7.1.2 K近鄰算法的計算步驟153
7.1.3 K近鄰算法的代碼實現155
7.2 案例實戰:手寫數字識別模型157
7.2.1 案例背景157
7.2.2 手寫數字識別的原理157
7.2.3 手寫數字識別的代碼實現159
7.3 圖像識別原理詳解162
第8章 隨機森林模型
8.1 隨機森林模型的原理和代碼實現166
8.1.1 集成模型簡介166
8.1.2 隨機森林模型的基本原理167
8.1.3 隨機森林模型的代碼實現168
8.2 案例實戰:股票漲跌預測模型170
8.2.1 股票基本數據獲取170
8.2.2 股票衍生變量生成173
8.2.3 多因子模型搭建181
8.2.4 模型使用與評估184
8.2.5 參數調優186
8.2.6 收益回測曲線繪製188
第9章 AdaBoost與GBDT模型
9.1 AdaBoost算法原理190
9.1.1 AdaBoost算法的核心思想190
9.1.2 AdaBoost算法的數學原理概述191
9.1.3 AdaBoost算法的數學原理舉例194
9.1.4 AdaBoost算法的簡單代碼實現200
9.2 AdaBoost算法案例實戰:信用卡精准營銷模型201
9.2.1 案例背景201
9.2.2 模型搭建201
9.2.3 模型預測及評估202
9.2.4 模型參數介紹205
9.3 GBDT算法原理206
9.3.1 GBDT算法的核心思想206
9.3.2 GBDT算法的數學原理概述208
9.3.3 GBDT算法的數學原理舉例208
9.3.4 GBDT算法的簡單代碼實現213
9.4 GBDT算法案例實戰:產品定價模型214
9.4.1 案例背景214
9.4.2 模型搭建214
9.4.3 模型預測及評估217
9.4.4 模型參數介紹219
第10章 機器學習神器:XGBoost與LightGBM算法
10.1 XGBoost算法原理223
10.1.1 XGBoost算法的核心思想224
10.1.2 XGBoost算法的數學原理概述224
10.1.3 XGBoost算法的簡單代碼實現225
10.2 XGBoost算法案例實戰1:金融反欺詐模型226
10.2.1 案例背景226
10.2.2 模型搭建226
10.2.3 模型預測及評估228
10.2.4 模型參數調優230
10.3 XGBoost算法案例實戰2:信用評分卡模型233
10.3.1 案例背景233
10.3.2 多元線性回歸模型234
10.3.3 GBDT回歸模型235
10.3.4 XGBoost回歸模型237
10.4 LightGBM算法原理241
10.4.1 LightGBM
主題書展
更多
主題書展
更多書展今日66折
您曾經瀏覽過的商品
購物須知
大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。
特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。
無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。
為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。
若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。