TOP
0
0
【23號簡體館日】限時三天領券享優惠!!
Python機器學習系統構建(原書第3版)(簡體書)
滿額折

Python機器學習系統構建(原書第3版)(簡體書)

人民幣定價:89 元
定  價:NT$ 534 元
優惠價:87465
領券後再享88折
海外經銷商無庫存,到貨日平均30天至45天
可得紅利積點:13 點
相關商品
商品簡介
作者簡介
名人/編輯推薦
目次

商品簡介

Python是一種非常通用的編程語言,得力於其廣泛的工具庫支持,常用於開發機器學習應用。
《Python機器學習系統構建(原書第3版)》涉及機器學習領域的一些新進展,通過對常用數據集的轉換和工具庫的介紹,幫助你構建實用的機器學習系統。
使用機器學習方法可以從數據的角度獲得更深刻的洞察,這是現今應用程序開發者和分析人員需要的一項關鍵技能。Python作為一種動態語言,可用於快速探索和實驗。
《Python機器學習系統構建(原書第3版)》展示了如何在原始數據中準確發掘出模式,首先回顧Python機器學習的基礎知識,接著介紹相關的工具庫。
通過《Python機器學習系統構建(原書第3版)》,你將獲得新的工具,並理解構建機器學習系統所需的必要知識,以更好地解決現實數據分析問題。
通過《Python機器學習系統構建(原書第3版)》的學習,你將能夠使用諸如分類、情感分析、計算機視覺、強化學習和神經網絡等技術及方法構建機器學習系統。

作者簡介

路易斯·佩德羅·科埃略(Luis Pedro Coelho),計算生物學家,專注於分析微生物群落DNA,並描繪其行為方式。博士畢業於卡內基·梅隆大學。曾出版多本科學書籍。早在2004年就開始使用Python進行開發工作,是多個開源工具庫的開發者。他的主要研究方向是大規模數據集的處理與集成,以及應用機器學習技術分析生物標本影像。目前在復旦大學任教。

威力·裡克特(Willi Richert),機器學習/機器人專業的博士,對異構機器人的學習和模仿頗有心得。目前在微軟就職,他的研究方向涉及多個機器學習領域,如深度學習、主動學習和統計機器翻譯。威力兒時就開始在Commodore128上用BASIC編程。後來又逐步了解了TurboPascal、Java、C++,直到最後發現他的真愛——Python。

馬蒂厄·布魯切爾(Matthieu Brucher),計算機科學家,擅長高性能計算和計算建模,目前就職於JPMorgan的量化研究小組。他也是AudioToolKit工具(一個實時音頻信號處理的工具庫)的主要開發者。他博士畢業於斯特拉斯堡大學,研究方向是機器學習和信號處理,並於巴黎第十一大學和法國高等電力大學取得兩個理學碩士學位——一個是數字電路和信號處理方向,另一個是自動化方向。他還取得了巴斯斯巴大學的音樂學碩士學位。

名人/編輯推薦

本書面向數據科學家、機器學習開發人員,以及想學習如何構建日趨復雜的機器學習系統的Python開發人員,詳細講解如何使用scikit-learn、TensorFlow等工具庫構建高效的智能系統。
在無須編程的情況下,計算機系統通過機器學習也能進行學習。Python是一種非常通用的編程語言,得力於其廣泛的工具庫支持,常用於開發機器學習應用。本書涉及機器學習領域的一些新進展,通過對常用數據集的轉換和工具庫的介紹,幫助你構建實用的機器學習系統。
使用機器學習方法可以從數據的角度獲得更深刻的洞察,這是現今應用程序開發者和分析人員需要的一項關鍵技能。Python作為一種動態語言,可用於快速探索和實驗。本書向你展示了如何在原始數據中準確發掘出模式,書中首先回顧Python機器學習的基礎知識,接著介紹相關的工具庫。通過建模和創建推薦系統,你將快速掌握有關數據的真是項目。通過本書,你將獲得新的工具,並理解構建機器學習系統所需的必要知識,以更好地解決現實數據分析問題。

在機器學習的幫助下,無須對模型或系統進行明確的編程。通過本書,你將了解如何使用可用的最佳類庫支持構建高效的智能系統,這些類庫包括scikit-learn、TensorFlow等。
本書的讀者物件
本書面向的是數據科學家、機器學習開發人員以及想學習構建日趨復雜的機器學習系統的Python開發人員。我們將使用Python的機器學習潛能開發有效的解決方案。讀者需要提前了解一些關於Python的編程知識。
本書的主要內容
第1章介紹機器學習的基本思想和一個非常簡單的TensorFlow示例。盡管這是個簡單的示例,但我們還是會遇到過擬合的風險挑戰。
第2章使用真實數據,通過訓練計算機區分不同類型的花進行分類研究。
第3章解釋如何使用回歸算法處理數據,這一直是一個經典的討論話題。你還可以了解高級的回歸技術,如Lasso和ElasticNet。
第4章主要介紹如何使用logistic回歸來確定某個問題的用戶答案好還是不好,還將展示如何使用偏差-方差的平衡調試機器學習模型。
第5章研究有助於縮小數據量的其他現有方法,以便機器學習算法能夠處理這些數據。
第6章展示將詞袋模型方法運用在找到相似帖子的場景中的高適用度,而查找過程無須真正理解這些帖子。
第7章建立基於客戶產品評級的推薦系統。我們還會看到不需要評級數據(用戶不一定總會提供這些數據),如何從購物數據創建推薦機制。
第8章介紹相關的基本原理以及使用TensorFlow的CNN和RNN的示例。
第9章解釋樸素貝葉斯的工作原理,以及如何使用樸素貝葉斯對tweet進行分類,以區分出這些tweet是積極情緒還是消極情緒。
第10章不僅將每一個帖子指定給一個單獨的集群,還將帖子分配到多個主題中,同真實的文本可以涉及多個主題一樣。
第11章設置一個場景。有人弄混了龐大且復雜的音樂收藏夾,我們希望構建某種規則,讓機器學習者對這些歌曲進行分類。事實證明,通過信任他人的專業知識來創建自己的特征有時更好。本章還將介紹語音如何轉為文本。
第12章介紹如何通過從數據中提取特征將分類應用於處理圖像中的特定上下文。本章還會介紹如何修改這些方法以找到一個集合中的相似圖像,以及使用TensorFlow的CNN和GAN的應用。
第13章涵蓋有關Atari遊戲的強化學習和深度Q網絡的基本原理。
第14章研究利用多核或計算集群的優勢來處理更大量數據的一些方法。本章還將介紹云計算(使用Amazon Web Services作為云提供商)。
充分利用本書
本書假定你了解Python,並且知道如何使用easy_install或pip安裝模塊庫。讀者無須了解任何高等數學理論,如微積分或矩陣代數。
本書使用的計算機語言版本如下,不過任何更新的版本都適用:
Python 3.5
NumPy 1.13.3
SciPy 1.0.0
scikit-learn的新版本
在我們代碼包中的所有示例都可以在Jupyter notebook編輯器中打開。
下載示例代碼及彩色圖像
本書的示例代碼及所有截圖和樣圖,可以通過個人帳號下載,也可以訪問華章圖書官網,通過注冊並登錄個人帳號下載。

目次

前言
第1章 Python機器學習入門1
1.1 機器學習和Python—夢之隊1
1.1.1 本書涵蓋的和未涵蓋的內容2
1.1.2 如何最好地閱讀本書3
1.1.3 遇到困難怎麼辦4
1.1.4 入門指南5
1.1.5 機器學習基礎10
1.1.6 第一個機器學習的小應用11
1.2 小結23
第2章 使用現實示例進行分類24
2.1 鳶尾花數據集24
2.1.1 可視化是一個很好的開始25
2.1.2 用scikit-learn分類25
2.1.3 建立我們的第一個分類模型26
2.2 評估—留出數據和交叉驗證27
2.3 如何測量和比較分類器29
2.4 更復雜的數據集和最近鄰分類器30
2.4.1 了解種子數據集30
2.4.2 特征和特征工程 31
2.4.3 最近鄰分類31
2.4.4 查看決策邊界32
2.5 使用哪個分類器35
2.6 小結35
第3章 回歸37
3.1 用回歸方法預測房價走勢37
3.2 多維屬性回歸40
3.3 回歸中的交叉驗證41
3.3.1 懲罰化或正則化回歸42
3.3.2 L1和L2懲罰項42
3.4 在scikit-learn中使用Lasso或 ElasticNet43
3.4.1 Lasso路徑的可視化44
3.4.2 P-greater-than-N場景45
3.4.3 一個基於文本文檔的例子45
3.4.4 主流的超參設置方法47
3.5 用TensorFlow實現回歸50
3.6 小結54
第4章 分類Ⅰ—檢測劣質答案55
4.1 本章概覽55
4.2 學習分類優質答案56
4.2.1 數據實例調整56
4.2.2 分類器調優56
4.3 數據獲取56
4.3.1 將數據轉換為可用的數據塊58
4.3.2 屬性的預選擇和處理58
4.3.3 定義什麼是優質答案59
4.4 創建我們的第一個分類器60
4.4.1 特征工程60
4.4.2 訓練分類器61
4.4.3 評價分類器的性能62
4.4.4 設計更多的特征62
4.5 如何改進性能65
4.5.1 偏置、方差和它們之間的平衡66
4.5.2 修復高偏置66
4.5.3 修復高方差66
4.5.4 高偏置還是低偏置67
4.6 使用logistic回歸69
4.6.1 用一個小例子了解一些數學原理69
4.6.2 將logistic回歸用於我們的帖子分類問題71
4.7 探索準確率背後的細節—精度和召回73
4.8 為分類器減負75
4.9 整合分類器76
4.10 用TensorFlow分類77
4.11 小結82
第5章 降維83
5.1 本章概覽83
5.2 選擇特征84
5.2.1 使用過濾器檢測冗餘特征84
5.2.2 使用包裝法從模型中查詢特征90
5.2.3 其他特征選擇方法93
5.3 特征投影93
5.3.1 主成分分析93
5.3.2 PCA的局限性以及LDA如何提供幫助95
5.4 多維縮放96
5.5 用於降維的自動編碼器或神經網絡99
5.6 小結103
第6章 聚類—查找相關帖子105
6.1 測量帖子間的相關性 105
6.1.1 不應該這麼做106
6.1.2 應該怎麼做106
6.2 預處理—將測量的相似性作為常用詞的相似數量107
6.2.1 將原始文本轉換成詞袋107
6.2.2 我們的成就和目標115
6.3 聚類116
6.3.1 K-means 116
6.3.2 獲取測試數據以評估我們的想法119
6.3.3 聚類帖子120
6.4 解決最初的挑戰120
6.5 調整參數123
6.6 小結123
第7章 推薦系統125
7.1 評級預測和推薦125
7.2 切分訓練集和測試集127
7.3 訓練數據歸一化127
7.4 用最近鄰方法實現推薦129
7.5 用回歸方法實現推薦132
7.6 結合多種方法133
7.7 購物籃分析135
7.7.1 獲得有用的預測結果136
7.7.2 分析超市購物籃137
7.8 關聯規則挖掘140
7.9 小結141
第8章 人工神經網絡與深度學習143
8.1 使用TensorFlow143
8.1.1 TensorFlow API 144
8.1.2 圖144
8.1.3 會話145
8.1.4 有用的操作146
8.2 保存和還原神經網絡147
8.2.1 訓練神經網絡149
8.2.2 卷積神經網絡149
8.2.3 循環神經網絡156
8.3 LSTM用於文本預測157
8.4 LSTM用於圖像處理160
8.5 小結162
第9章 分類Ⅱ—情感分析163
9.1 本章概覽163
9.2 獲取Twitter數據163
9.3 介紹樸素貝葉斯分類器164
9.3.1 了解貝葉斯定理 164
9.3.2 簡單化165
9.3.3 使用樸素貝葉斯進行分類166
9.3.4 對未曾出現的和奇怪的單詞進行說明168
9.3.5 對算術下溢進行說明169
9.4 創建並優化第一個分類器171
9.4.1 首先解決容易的問題171
9.4.2 使用所有類173
9.4.3 調整分類器參數175
9.5 清理tweet179
9.6 考慮單詞的類型180
9.6.1 確定單詞類型181
9.6.2 使用SentiWordNet成功作弊182
9.6.3 我們的第一個評估器184
9.6.4 把所有東西放在一起186
9.7 小結187
第10章 主題建模188
10.1 隱含狄利克雷分配188
10.1.1 構建主題模型189
10.1.2 按主題比較文檔 193
10.1.3 為整體維基百科建模195
10.1.4 選擇主題數量197
10.2 小結198
第11章 分類III—音樂流派分類199
11.1 本章概覽199
11.2 獲取音樂數據199
11.3 觀察音樂數據201
11.4 使用FFT構建第一個分類器204
11.4.1 增加實驗靈活性204
11.4.2 訓練分類器205
11.4.3 用混淆矩陣測試多類別問題的準確率207
11.4.4 另一種用接收者- 操作者特征測量分類性能的方法209
11.5 使用梅爾頻率倒譜系數改善分類器性能212
11.6 用TensorFlow分類音樂215
11.7 小結220
第12章 計算機視覺222
12.1 圖像處理簡介222
12.1.1 加載和顯示圖像 223

您曾經瀏覽過的商品

購物須知

大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。

特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。

無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。

為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。

若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。

優惠價:87 465
海外經銷商無庫存,到貨日平均30天至45天

暢銷榜

客服中心

收藏

會員專區