TOP
0
0
三民出版.新書搶先報|最速、最優惠的新鮮貨報給你知!
機器學習:軟件工程方法與實現(簡體書)
滿額折

機器學習:軟件工程方法與實現(簡體書)

商品資訊

人民幣定價:109 元
定價
:NT$ 654 元
優惠價
87569
海外經銷商無庫存,到貨日平均30天至45天
下單可得紅利積點:17 點
商品簡介
名人/編輯推薦
目次
相關商品

商品簡介

全書共16章,分為4個部分:第壹部分工程基礎篇(1~3)介紹了機器學習和軟件工程的融合,涉及理論、方法、工程化的數據科學環境和數據準備;第二部分機器學習基礎篇(4~5)講述了機器學習建模流程、核心概念,數據分析方法;第三部分特徵篇(6~8)詳細介紹了多種特徵離散化方法和實現、特徵自動衍生工具和自動化的特徵選擇原理與實現;第四部分模型篇(9~16)首先,深入地剖析了線性模型、樹模型和集成模型的原理,以及模型調參方法、自動調參、模型性能評估和模型解釋等;然後,通過5種工程化的模型上線方法講解了模型即服務;最後,講解了模型的穩定性監控的方法與實現,這是機器學習項目的最後一環。

名人/編輯推薦

大型金融集團專家撰寫,將軟件工程方法、工具和策略應用到機器學習,提供高質量代碼設計和工業應用框架

目次

前言
第一部分 工程基礎篇
第1章 機器學習軟件工程方法 2
1.1 機器學習簡述 2
1.1.1 機器學習與人工智能、深度學習等的關係 2
1.1.2 機器學習類別與範式 4
1.2 軟件工程方法 13
1.2.1 機器學習中的軟件工程 15
1.2.2 編碼和測試 18
1.3 樸素貝葉斯測試驅動開發案例 21
1.3.1 開發準備 22
1.3.2 開發郵件分類器 24
1.4 本章小結 29
第2章 工程環境準備 30
2.1 Anaconda 31
2.1.1 安裝Anaconda 31
2.1.2 使用conda管理環境 32
2.1.3 Jupyter Notebook 基礎使用和示例 34
2.2 使用Pipenv定制Python環境 37
2.2.1 Pipenv簡介 38
2.2.2 Pipenv基礎使用和示例 39
2.3 Docker打包環境 41
2.3.1 Docker簡述 42
2.3.2 Docker架構 43
2.3.3 Docker基礎使用和示例 45
2.3.4 打包示例 46
2.4 標準化在數據科學項目中的意義 48
2.5 數據科學項目工程環境 49
2.5.1 開發鏡像 50
2.5.2 項目工程模板 51
2.5.3 操作演示 54
2.6 本章小結 55
第3章 實驗數據準備 56
3.1 常用數據分佈 56
3.1.1 伯努利分佈 58
3.1.2 二項分佈 58
3.1.3 泊松分佈 58
3.1.4 均勻分佈 59
3.1.5 正態分佈 59
3.1.6 指數分佈 60
3.2 開源數據集 62
3.2.1 開源數據集介紹 62
3.2.2 scikit-learn中的數據集 63
3.3 scikit-learn數據集生成接口 66
3.3.1 常用接口 66
3.3.2 分類模型隨機數據生成 67
3.3.3 回歸模型隨機數據生成 68
3.3.4 聚類模型隨機數據生成 69
3.4 隨機數生成簡介 70
3.4.1 隨機數生成的原理和概念 71
3.4.2 隨機數生成示例 72
3.4.3 隨機數應用場景介紹 72
3.5 本章小結 73
第二部分 機器學習基礎篇
第4章 機器學習項目流程與核心概念 76
4.1 機器學習項目流程 76
4.1.1 如何定義Y 78
4.1.2 如何取樣X 81
4.1.3 如何劃分數據集 83
4.1.4 如何選擇學習算法 84
4.1.5 數據分析和處理 85
4.1.6 特徵工程 87
4.1.7 模型訓練與調參 88
4.1.8 模型評估與報告 89
4.1.9 模型部署 91
4.1.10 模型監控 91
4.1.11 模型重訓或重建 92
4.2 機器學習算法8個核心概念 92
4.2.1 損失函數和正則化 92
4.2.2 欠擬合與過擬合、偏差與方差 98
4.2.3 交叉驗證 101
4.2.4 數據洩露 104
4.3 本章小結 106
第5章 數據分析與處理 107
5.1 變量的類型 107
5.2 常用分析方法 108
5.2.1 整體數據概覽 109
5.2.2 單變量可視化分析 110
5.2.3 雙變量可視化分析 113
5.2.4 多變量可視化分析 118
5.3 缺失值分析與處理 120
5.3.1 數據缺失的類型 120
5.3.2 查看缺失情況 120
5.3.3 缺失值處理方式 122
5.4 異常值分析與處理 126
5.4.1 查看異常情況 126
5.4.2 異常值處理 129
5.5 數據分析工具包開發實戰 129
5.5.1 核心功能 129
5.5.2 使用示例 130
5.5.3 核心代碼 131
5.6 本章小結 139
第三部分 特徵篇
第6章 特徵工程 142
6.1 特徵工程簡介 142
6.2 特徵處理基礎方法和實現 144
6.2.1 定量特徵 146
6.2.2 序數特徵 148
6.2.3 類別特徵 149
6.2.4 WOE編碼 153
6.2.5 日期特徵 155
6.3 特徵離散化方法和實現 156
6.3.1 等寬和等頻離散法 158
6.3.2 信息熵分箱原理與實現 161
6.3.3 Best-KS分箱原理與實現 167
6.3.4 卡方分箱原理與實現 172
6.3.5 分箱效果 178
6.4 本章小結 178
第7章 基於Featuretools的自動特徵衍生 180
7.1 特徵衍生 180
7.2 Featuretools簡介 181
7.2.1 安裝 182
7.2.2 核心概念和接口介紹 182
7.3 Featuretools原理 186
7.3.1 特徵綜合抽象 187
7.3.2 深度特徵綜合算法 187
7.4 Featuretools實踐案例 189
7.4.1 流程 189
7.4.2 捷信數據 189
7.4.3 構建實體和實體集 191
7.4.4 構建關係 193
7.4.5 特徵基元 196
7.4.6 深度特徵合成 197
7.5 本章小結 198
第8章 特徵選擇 199
8.1 特徵選擇概述 199
8.1.1 特徵選擇及其意義 200
8.1.2 業務層特徵選擇 200
8.1.3 技術層特徵選擇 201
8.2 特徵選擇流程與模式 204
8.2.1 數據質量和特徵質量 204
8.2.2 串聯和並聯流程 205
8.2.3 特徵選擇結果評價 206
8.3 特徵預測力指標 206
8.3.1 相關性指標 207
8.3.2 關聯性指標 208
8.4 過濾法與實現 211
8.4.1 常用單指標過濾法 211
8.4.2 相關性與IV雙指標過濾法 213
8.4.3 最小冗餘最大相關 214
8.5 包裹法與實現 215
8.5.1 前向選擇實現 217
8.5.2 後向選擇實現 218
8.5.3 Stepwise實現 219
8.6 嵌入法與實現 222
8.6.1 基於隨機森林的特徵選擇 222
8.6.2 基於正則的特徵選擇 223
8.7 特徵選擇工具包開發實戰 224
8.8 本章小結 230
第四部分 模型篇
第9章 線性模型 232
9.1 普通線性回歸模型 232
9.1.1 線性回歸 233
9.1.2 線性回歸的假設 236
9.1.3 線性模

您曾經瀏覽過的商品

購物須知

大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。

特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。

無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。

為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。

若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。

優惠價:87 569
海外經銷商無庫存,到貨日平均30天至45天

暢銷榜

客服中心

收藏

會員專區