TOP
0
0
【簡體曬書節】 單本79折,5本7折,優惠只到5/31,點擊此處看更多!
Python數據挖掘技術及應用(微課版)(簡體書)
滿額折
Python數據挖掘技術及應用(微課版)(簡體書)
Python數據挖掘技術及應用(微課版)(簡體書)
Python數據挖掘技術及應用(微課版)(簡體書)
Python數據挖掘技術及應用(微課版)(簡體書)
Python數據挖掘技術及應用(微課版)(簡體書)
Python數據挖掘技術及應用(微課版)(簡體書)
Python數據挖掘技術及應用(微課版)(簡體書)
Python數據挖掘技術及應用(微課版)(簡體書)
Python數據挖掘技術及應用(微課版)(簡體書)

Python數據挖掘技術及應用(微課版)(簡體書)

商品資訊

人民幣定價:69 元
定價
:NT$ 414 元
優惠價
87360
領券後再享89折起
海外經銷商無庫存,到貨日平均30天至45天
可得紅利積點:10 點
相關商品
商品簡介
作者簡介
目次

商品簡介

《Python數據挖掘技術及應用(微課版)/清華開發者書庫·Python》特點:
內容系統全面:
全面介紹數據挖掘的經典和主流算法。
原理淺顯易懂:
循序漸進闡述各類數據挖掘算法原理。
配套視頻教程:
提供配套視頻講解數據挖掘算法實現。
算法代碼實現:
使用Python3.6.2實現書中所有算法。
配套資源豐富:
配有教學課件、數據集和源代碼。
《Python數據挖掘技術及應用(微課版)/清華開發者書庫·Python》是一本全面介紹數據挖掘技術的專業書籍,系統地闡述了數據挖掘的相關概念、原理、算法思想和算法的Python代碼實現。
《Python數據挖掘技術及應用(微課版)/清華開發者書庫·Python》共分13章,各章相對獨立成篇,以利於讀者選擇性學習。13章內容分別為緒論、pandas數據處理、認識數據、數據預處理、決策樹分類、貝葉斯分類、支持向量機分類、感知器分類、回歸、聚類、關聯規則挖掘、推薦系統、電商評論網絡爬取與情感分析。
《Python數據挖掘技術及應用(微課版)/清華開發者書庫·Python》可作為高等院校計算機科學與技術、數據科學與大數據及相關專業的數據挖掘、數據分析課程教材,亦可作為數據挖掘、數據分析人員的參考書。

作者簡介

曹潔 男,博士,現為鄭州輕工業大學軟件學院校聘副教授。主講《Python語言程序設計》、《數據挖掘》。主編出版《Python語言程序設計》、《Python數據分析》、《大數據技術》等多本教材。

前言隨著物聯網、移動互聯網、智能終端、Web 2.0和云計算等新興信息技術的快速發展,以社交網絡、社區、博客和電子商務為代表的新型應用得到廣泛使用,這些應用不斷產生大量的數據。人們希望了解大數據中所隱含的有價值的知識和數據間有價值的潛在聯系,“數據挖掘”是實現這些期盼的有力工具。

數據挖掘是一個在海量數據中利用各種分析工具發現模型與數據間關係的過程,它可以幫助決策者尋找數據間潛在的某種關聯,發現被隱藏的、被忽略的因素,因而被認為是在這個數據爆炸時代深層次認識數據、有效利用數據的一種有效方法。

Python具有開源、簡潔易讀、快速上手、多場景應用以及完善的生態和服務體系等優點,使其在數據挖掘領域中的地位顯得尤為突出,Python已經當仁不讓地成為了數據挖掘人員的一把“利器”。

1. 本書編寫特色

內容系統全面: 全面介紹數據挖掘的經典和主流算法。

原理淺顯易懂: 循序漸進闡述各類數據挖掘算法原理。

配套視頻教程: 提供配套視頻講解數據挖掘算法實現。

算法代碼實現: 使用Python 3.6.x實現書中所有算法。

2. 本書內容組織

第1章緒論。本章主要講解什麼是數據挖掘以及數據挖掘的相關概念。先講解數據挖掘的相關概念,以及數據挖掘算法的分類。然後,講解數據挖掘的步驟,以及數據挖掘的兩種典型應用。最後,講解數據挖掘面臨的主要挑戰。

第2章pandas數據處理。本章主要講解pandas數據處理庫。先對pandas的一維數組型的Series數據結構和二維表格型的DataFrame數據結構進行講解。然後講解DataFrame物件的基本運算,具體包括數據篩選、數據預處理、數據運算與排序、數學統計、數據分組與聚合。接著,講解pandas數據可視化。最後,講解了pandas讀寫csv文件、讀取txt文件、讀寫Excel文件。

第3章認識數據。先講解數據類型,具體包括屬性類型和數據物件的類型。然後講解數據質量分析,具體包括缺失值分析、異常值分析、一致性分析。最後,講解數據特征分析,具體包括分布特征、統計量特征、周期性特征和相關性特征。

第4章數據預處理。先講解數據清洗,具體包括缺失值處理、噪聲數據處理。接著,講解數據集成,具體包括實體識別、屬性冗餘處理、元組重復處理、屬性值衝突處理,數據規範化。然後,講解數據離散化。之後講解數據歸約,具體包括過濾法歸約、包裝法歸約、嵌入法歸約。最後,講解主成分分析法和線性判別分析法兩種數據降維方法。

第5章決策樹分類。先講解數據物件間的相似性和相異性的度量。然後,講解分類的相關概念和分類的一般流程。接著,講解決策樹分類的相關概念,ID3決策樹的工作原理,以及C4.5決策樹的工作原理。最後,講解CART決策樹。

第6章貝葉斯分類。先講解概率基礎和貝葉斯定理。然後,講解樸素貝葉斯分類原理與分類流程。最後,講解高斯樸素貝葉斯分類、多項式樸素貝葉斯分類、伯努利樸素貝葉斯分類。

第7章支持向量機分類。先講解支持向量機分類原理。然後,講解線性可分支持向量機的線性決策邊界、線性分類器邊緣、模型訓練。最後,講解sklearn機器學習庫提供的三種支持向量機分類模型。

第8章感知器分類。先講解人工神經元與激活函數。然後,講解感知器模型和感知器學習算法。最後,講解Python實現感知器學習算法和使用感知器分類鳶尾花數據。

第9章回歸。先講解回歸的相關概念。然後,講解一元線性回歸方程的參數求解過程,多元線性回歸方程的參數求解過程,以及非線性回歸方程的參數求解過程。最後,講解邏輯回歸。

第10章聚類。先講解聚類的相關概念、聚類方法類型、聚類應用領域。然後,講解k均值聚類原理,並給出鳶尾花k均值聚類的Python實現。接著,講解層次聚類原理,並給出凝聚層次聚類的Python實現、BIRCH聚類的Python實現。最後,講解密度聚類原理,並給出DBSCAN密度聚類的Python實現。

第11章關聯規則挖掘。先講解關聯規則的相關概念、關聯規則類型。接著,講解頻繁項集產生的先驗原理、Apriori算法產生頻繁項集的過程,並給出頻繁項集及其支持度的Python實現。然後,講解關聯規則產生的原理,並給出Apriori算法產生關聯規則的方式及其算法實現。最後,講解構建FP樹,並給出FP樹的挖掘過程。

第12章推薦系統。先講解推薦系統的相關概念、推薦系統的類型。接著,講解基於內容的推薦,並給出基於內容的推薦的Python實現。然後,講解基於用戶的協同過濾推薦,並給出基於用戶的協同過濾推薦的Python實現。最後,講解基於物品的協同過濾推薦,並給出基於物品的協同過濾推薦的Python實現。

第13章電商評論網絡爬取與情感分析。先講解網頁的概念、網絡爬蟲的工作流程。然後,講解如何使用BeautifulSoup庫提取網頁信息。接著,講解如何使用urllib庫編寫簡單的網絡爬蟲,以及爬取京東小米手機評論的整個過程。最後,講解對手機評論文本進行情感分析。

3. 本書適用範圍

(1) 高等院校各專業的數據挖掘、數據分析課程教材。

(2) 數據挖掘、數據分析人員的參考書。

在本書編寫和出版過程中得到了鄭州輕工業大學、清華大學出版社的大力支持和幫助,在此表示感謝。

在本書的撰寫過程中,參考了大量專業書籍和網絡資料,在此向這些作者表示感謝。

參與本書編寫的有曹潔、鄧璐娟、郝水俠、劉字、李現偉、崔霄、鄭倩、張世征、李祖賀。

由於編寫時間倉促,編者水平有限,書中肯定會有不少缺點和不足,熱切期望得到專家和讀者的批評指正,在此表示感謝。您如果遇到任何問題,或有更多的寶貴意見,歡迎發送郵件至郵箱,期待能夠收到您的真摯反饋。


編者2021年2月


目次

目錄




第1章緒論1

1.1數據挖掘的相關概念1

1.2數據挖掘的步驟2

1.3數據挖掘的典型應用3

1.3.1數據挖掘在市場營銷中的應用3

1.3.2數據挖掘在企業危機管理中的應用3

1.4數據挖掘的主要挑戰3

1.4.1數據挖掘查詢語言3

1.4.2用戶交互4

1.4.3並行、分布和增量挖掘算法4

1.4.4數據類型的多樣化4

1.5本章小結5

第2章pandas數據處理6

2.1Series物件6

2.1.1Series物件的創建6

2.1.2Series物件的屬性8

2.1.3Series物件的查看和修改8

2.2Series物件的基本運算9

2.2.1算術運算與函數運算9

2.2.2Series物件之間的運算10

2.3DataFrame物件10

2.3.1DataFrame物件的創建10

2.3.2DataFrame物件的屬性12

2.3.3查看和修改DataFrame物件的元素14

2.3.4判斷元素是否屬於DataFrame物件16

2.4DataFrame物件的基本運算17

2.4.1數據篩選17

2.4.2數據預處理19

2.4.3數據運算與排序33

2.4.4數學統計38

2.4.5數據分組與聚合44

2.5pandas數據可視化51

2.5.1繪制折線圖52

2.5.2繪制條形圖53

2.6pandas讀寫數據55

2.6.1讀寫csv文件56

2.6.2讀取txt文件59

2.6.3讀寫Excel文件60

2.7本章小結64

第3章認識數據65

3.1數據類型65

3.1.1屬性類型65

3.1.2數據集的類型66

3.2數據質量分析67

3.2.1缺失值分析68

3.2.2異常值分析69

3.2.3一致性分析72

3.3數據特征分析72

3.3.1分布特征72

3.3.2統計量特征73

3.3.3周期性特征78

3.3.4相關性特征80

3.4本章小結81

第4章數據預處理82

4.1數據清洗82

4.1.1處理缺失值82

4.1.2噪聲數據處理89

4.2數據集成90

4.2.1實體識別問題90

4.2.2屬性冗餘問題91

4.2.3元組重復問題91

4.2.4屬性值衝突問題92

4.3數據規範化92

4.3.1最小最大規範化92

4.3.2z分數規範化94

4.3.3小數定標規範化94

4.4數據離散化94

4.4.1無監督離散化95

4.4.2監督離散化96

4.5數據歸約96

4.5.1過濾法97

4.5.2包裝法99

4.5.3嵌入法99

4.6數據降維100

4.6.1主成分分析法101

4.6.2線性判別分析法101

4.7學生考試成績預處理102

4.8本章小結106

第5章決策樹分類107

5.1相似性和相異性的度量107

5.1.1數據物件之間的相異度107

5.1.2數據物件之間的相似度109

5.2分類概述111

5.2.1分類的基本概念111

5.2.2分類的一般流程112

5.3決策樹分類概述113

5.3.1決策樹的工作原理113

5.3.2選擇最佳劃分屬性的度量117

5.3.3決策樹分類待測樣本的過程120

5.4ID3決策樹120

5.4.1ID3決策樹的工作原理120

5.4.2Python實現ID3決策樹122

5.4.3使用ID3決策樹預測貸款申請130

5.4.4ID3決策樹的缺點131

5.5C4.5決策樹的分類算法131

5.5.1C4.5決策樹的工作原理131

5.5.2Python實現C4.5決策樹133

5.5.3使用C4.5決策樹預測鳶尾花類別139

5.6CART決策樹139

5.6.1CART決策樹的工作原理139

5.6.2Python實現CART決策樹139

5.7本章小結143

第6章貝葉斯分類144

6.1貝葉斯定理144

6.1.1概率基礎144

6.1.2貝葉斯定理簡介146

6.1.3先驗概率與後驗概率147

6.2樸素貝葉斯分類的原理與分類流程147

6.2.1貝葉斯分類原理147

6.2.2樸素貝葉斯分類的流程147

6.3高斯樸素貝葉斯分類150

6.3.1scikitlearn實現高斯樸素貝葉斯分類150

6.3.2Python實現iris高斯樸素貝葉斯分類151

6.4多項式樸素貝葉斯分類156

6.5伯努利樸素貝葉斯分類157

6.6本章小結157

第7章支持向量機分類158

7.1支持向量機概述158

7.1.1支持向量機的分類原理158

7.1.2最大邊緣超平面158

7.2線性支持向量機159

7.2.1線性決策邊界159

7.2.2線性分類器邊緣160

7.2.3訓練線性支持向量機模型161

7.3Python實現支持向量機163

7.3.1SVC支持向量機分類模型164

7.3.2NuSVC支持向量機分類模型166

7.3.3LinearSVC支持向量機分類模型167

7.4本章小結168

第8章感知器分類169

8.1人工神經元169

8.1.1神經元概述169

8.1.2激活函數170

8.2感知器171

8.2.1感知器模型171

8.2.2感知器學習算法172

8.3Python實現感知器學習算法概述174

8.3.1Python實現感知器學習算法174

8.3.2使用感知器分類鳶尾花數據175

8.4本章小結177

第9章回歸178

9.1回歸概述178

9.1.1回歸的概念178

9.1.2回歸處理流程178

9.1.3回歸的分類178

9.2一元線性回歸178

9.2.1一元線性回歸模型178

9.2.2使用一元線性回歸預測房價182

9.3多元線性回歸185

9.3.1多元線性回歸模型185

9.3.2使用多元線性回歸分析廣告媒介與銷售額之間的關係187

9.3.3多元線性回歸模型預測電能輸出188

9.4非線性回歸191

9.4.1多項式回歸191

9.4.2非多項式的非線性回歸195

9.5邏輯回歸198

9.5.1邏輯回歸模型199

9.5.2對鳶尾花數據進行邏輯回歸分析201

9.6本章小結203

第10章聚類204

10.1聚類概述204

10.1.1聚類的概念204

10.1.2聚類方法類型205

10.1.3聚類應用領域206

10.2k均值聚類206

10.2.1k均值聚類的原理206

10.2.2Python實現對鳶尾花的k均值聚類208

10.3層次聚類方法211

10.3.1層次聚類的原理211

10.3.2Python實現凝聚層次聚類214

10.3.3BIRCH聚類的原理217

10.3.4Python實現BIRCH聚類220

10.4密度聚類221

10.4.1密度聚類的原理221

10.4.2Python實現DBSCAN密度聚類224

10.5本章小結227

第11章關聯規則挖掘228

11.1關聯規則挖掘概述228

11.1.1購物籃分析228

11.1.2關聯規則相關概念229

11.1.3關聯規則類型231

11.2頻繁項集的產生232

11.2.1先驗原理233

11.2.2Apriori算法產生頻繁項集233

11.2.3候選項集的產生與剪枝236

11.2.4頻繁項集及其支持度的Python實現237

11.3關聯規則的產生239

11.3.1關聯規則產生的原理239

11.3.2Apriori算法產生關聯規則的方式240

11.3.3頻繁項集的緊湊表示241

11.4FP增長算法242

11.4.1構建FP樹243

11.4.2FP樹的挖掘245

11.5本章小結247

第12章推薦系統248

12.1推薦系統的概念248

12.1.1基本概念248

12.1.2推薦系統的類型249

12.2基於內容的推薦250

12.2.1文本表示251

12.2.2文本相似度257

12.2.3Python實現基於內容的推薦258

12.3基於用戶的協同過濾推薦261

12.3.1收集用戶偏好262

12.3.2尋找相似的用戶262

12.3.3為相似的用戶推薦商品266

12.4基於物品的協同過濾推薦267

12.4.1獲取用戶對物品的評分267

12.4.2計算物品共同出現的次數和一個物品被多少個用戶購買268

12.4.3計算物品之間的相似度268

12.4.4給用戶推薦物品269

12.5本章小結270

第13章電商評論網絡爬取與情感分析271

13.1網絡爬蟲概述271

13.1.1網頁的概念271

13.1.2網絡爬蟲的工作流程271

13.2使用BeautifulSoup庫提取網頁信息272

13.2.1BeautifulSoup的安裝272

13.2.2BeautifulSoup庫的導入272

13.2.3BeautifulSoup類的基本元素273

13.2.4HTML內容搜索274

13.3使用urllib庫編寫簡單的網絡爬蟲277

13.3.1發送不帶參數的GET請求277

13.3.2模擬瀏覽器發送帶參數的GET請求278

13.3.3URL解析279

13.4爬取京東小米手機評論280

13.4.1京東網站頁面分析280

13.4.2編寫京東小米手機評論爬蟲代碼283

13.5對手機評論文本進行情感分析286

13.5.1文本情感傾向分析的層次286

13.5.2中文文本情感傾向分析287

13.5.3評論文本情感傾向分析288

13.5.4評論文本分詞290

13.5.5去除停用詞291

13.5.6評論文本的LDA主題分析292

13.6本章小結297

參考文獻298


您曾經瀏覽過的商品

購物須知

大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。

特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。

無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。

為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。

若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。

優惠價:87 360
海外經銷商無庫存,到貨日平均30天至45天

暢銷榜

客服中心

收藏

會員專區