TOP
0
0
【23號簡體館日】限時三天領券享優惠!!
數據挖掘:原理與實踐(基礎篇)(簡體書)
滿額折

數據挖掘:原理與實踐(基礎篇)(簡體書)

人民幣定價:139 元
定  價:NT$ 834 元
優惠價:87726
領券後再享88折
海外經銷商無庫存,到貨日平均30天至45天
可得紅利積點:21 點
相關商品
商品簡介
名人/編輯推薦
目次

商品簡介

全書理論聯繫實際,全面講述資料挖據理論、技術及應用的教材。研討了資料採擷的方方面面,從基礎理論到複雜資料類型及其應用。不僅討論傳統的資料採擷問題,而且介紹了高級資料類型,例如文本、時間序列、離散序列、空間資料、圖資料和社會網路。本書由基礎篇和進階篇組成。基礎篇對應原書的第1~11章,進階篇對應原書的第12~20章。

名人/編輯推薦

以全面和綜合的方式探討了數據挖掘所有相關主題

目次

出版者的話
譯者序
前言
第1章 數據挖掘導論1
1.1 引言1
1.2 數據挖掘過程2
1.2.1 數據預處理階段4
1.2.2 分析階段5
1.3 基本數據類型5
1.3.1 非依賴型數據5
1.3.2 依賴型數據7
1.4 主要數據挖掘模塊總覽11
1.4.1 關聯模式挖掘12
1.4.2 數據聚類13
1.4.3 異常檢測13
1.4.4 數據分類14
1.4.5 複雜數據類型對問題定義的影響15
1.5 可擴展性問題和數據流場景17
1.6 應用案例淺述17
1.6.1 商店商品佈局17
1.6.2 客戶推薦18
1.6.3 醫療診斷18
1.6.4 Web日誌異常檢測19
1.7 小結19
1.8 文獻注釋19
1.9 練習題20
第2章 數據準備21
2.1 引言21
2.2 特徵提取和類型轉換22
2.2.1 特徵提取22
2.2.2 數據類型轉換23
2.3 數據清洗26
2.3.1 缺失項的處理27
2.3.2 錯誤項和不一致項的處理28
2.3.3 縮放與標準化29
2.4 數據約簡和轉換29
2.4.1 採樣30
2.4.2 特徵子集選取32
2.4.3 基於坐標軸旋轉的維度約簡32
2.4.4 基於類型轉換的降維39
2.5 小結47
2.6 文獻注釋48
2.7 練習題48
第3章 相似度和距離50
3.1 引言50
3.2 多維數據50
3.2.1 定量型數據51
3.2.2 類別型數據58
3.2.3 定量型和類別型的混合數據59
3.3 文本相似性度量60
3.4 時態的相似性度量61
3.4.1 時間序列相似性度量61
3.4.2 離散序列相似性度量65
3.5 圖的相似性度量67
3.5.1 單個圖中兩個節點之間的相似度67
3.5.2 兩個圖之間的相似度68
3.6 有監督的相似度函數69
3.7 小結70
3.8 文獻注釋70
3.9 練習題71
第4章 關聯模式挖掘73
4.1 引言73
4.2 頻繁模式挖掘模型74
4.3 關聯規則的生成框架76
4.4 頻繁項集挖掘算法77
4.4.1 暴力算法78
4.4.2 Apriori算法78
4.4.3 枚舉樹算法81
4.4.4 遞歸的基於後綴的模式生長方法89
4.5 替代模型:有趣模式96
4.5.1 統計相關係數97
4.5.2 χ2度量97
4.5.3 興趣比率98
4.5.4 對稱置信度98
4.5.5 列的余弦係數98
4.5.6 Jaccard係數和min-hash技巧98
4.5.7 集體強度100
4.5.8 與負模式挖掘的關係100
4.6 有用的元算法100
4.6.1 採樣方法101
4.6.2 數據劃分集成法101
4.6.3 推廣到其他數據類型101
4.7 小結102
4.8 文獻注釋102
4.9 練習題104
第5章 關聯模式挖掘:高級概念106
5.1 引言106
5.2 模式匯總106
5.2.1 最大模式107
5.2.2 閉包模式108
5.2.3 近似頻繁模式109
5.3 模式查詢110
5.3.1 一次預處理多次查詢111
5.3.2 把限制條件放入模式挖掘115
5.4 關聯模式挖掘的應用115
5.4.1 與其他數據挖掘問題的關係115
5.4.2 購物籃分析116
5.4.3 用戶信息分析116
5.4.4 推薦和協同過濾116
5.4.5 Web日誌分析117
5.4.6 生物信息學117
5.4.7 應用於其他複雜數據類型117
5.5 小結118
5.6 文獻注釋118
5.7 練習題119
第6章 聚類分析120
6.1 引言120
6.2 聚類的特徵選取121
6.2.1 過濾模型121
6.2.2 包裝模型124
6.3 基於代表點的算法124
6.3.1 k-means算法127
6.3.2 k-means內核算法128
6.3.3 k-medians算法128
6.3.4 k-medoids算法129
6.4 層次聚類算法130
6.4.1 自底向上凝聚的方法131
6.4.2 自頂向下分裂的方法135
6.5 基於概率模型的算法135
6.6 基於網格和基於密度的算法139
6.6.1 基於網格的算法139
6.6.2 DBSCAN141
6.6.3 DENCLUE143
6.7 基於圖的算法147
6.8 非負矩陣分解149
6.9 聚類驗證153
6.9.1 內部驗證度量153
6.9.2 外部驗證度量155
6.9.3 評價158
6.10 小結158
6.11 文獻注釋158
6.12 練習題159
第7章 聚類分析:高級概念161
7.1 引言161
7.2 類別型數據的聚類162
7.2.1 基於代表點的算法162
7.2.2 層次算法164
7.2.3 概率算法165
7.2.4 基於圖的算法166
7.3 可擴展的數據聚類167
7.3.1 CLARANS167
7.3.2 BIRCH168
7.3.3 CURE169
7.4 高維數據聚類170
7.4.1 CLIQUE172
7.4.2 PROCLUS172
7.4.3 ORCLUS174
7.5 半監督聚類176
7.5.1 單點監督177
7.5.2 成對監督177
7.6 用戶監督聚類與可視化監督聚類178
7.6.1 現有聚類算法的變體178
7.6.2 可視化聚類179
7.7 集成聚類181
7.7.1 選擇不同的集成組件181
7.7.2 組合不同的集成組件182
7.8 聚類應用183
7.8.1 應用到其他數據挖掘問題183
7.8.2 客戶分類與協同過濾183
7.8.3 文本應用184
7.8.4 多媒體應用184

您曾經瀏覽過的商品

購物須知

大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。

特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。

無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。

為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。

若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。

優惠價:87 726
海外經銷商無庫存,到貨日平均30天至45天