TOP
0
0
【簡體曬書區】 單本79折,5本7折,活動好評延長至5/31,趕緊把握這一波!
數據科學導論:Python語言(原書第3版)(簡體書)
滿額折

數據科學導論:Python語言(原書第3版)(簡體書)

人民幣定價:79 元
定  價:NT$ 474 元
優惠價:87412
領券後再享88折
海外經銷商無庫存,到貨日平均30天至45天
可得紅利積點:12 點
相關商品
商品簡介
作者簡介
名人/編輯推薦
目次

商品簡介

本書首先介紹如何設置基本的數據科學工具箱,然後帶你進入數據改寫和預處理階段,這一部分主要是闡明所有與核心數據科學活動相關的數據分析過程,如數據加載、轉換、修復以及數據探索和處理等。通過主要的機器學習算法、圖形分析技術,以及所有易於表現結果的可視化工具,實現對數據科學的概述。
本書對上一版內容進行了全面拓展和更新,涵蓋新版的Jupyter Notebook、NumPy、pandas和Scikit-learn等的新改進。此外,還介紹了深度學習(借助在Theano和Tensorflow平臺上運行的Keras庫)、漂亮的可視化(使用Seaborn和 ggplot)和Web部署(使用bottle)等新內容。
本書行文過程以數據科學項目為主體,輔以整潔的代碼和簡化的示例,能幫助你理解與項目相關的潛在原理和實際數據集。

作者簡介

阿爾貝托‧博斯凱蒂,數據科學家、信號處理和統計學方面的專家。主要從事自然語言處理、行為分析、機器學習和分布式處理等方面的挑戰性工作。

名人/編輯推薦

數據科學導論Python語言(原書第3版) [意] 阿爾貝托·博斯凱蒂(Alberto Boschetti) 盧卡·馬薩羅(Luca Massaron) 著於俊偉 譯Python Data Science EssentialsThird Edition

目次

譯者序
前言
作者簡介
審閱者簡介
第1章 新手上路1
1.1 數據科學與Python簡介1
1.2 Python的安裝2
1.2.1 Python 2還是Python 33
1.2.2 分步安裝4
1.2.3 安裝必要的工具包4
1.2.4 工具包升級6
1.3 科學計算發行版6
1.3.1 Anaconda7
1.3.2 使用conda安裝工具包7
1.3.3 Enthought Canopy8
1.3.4 WinPython8
1.4 虛擬環境8
1.5 核心工具包一瞥11
1.6 Jupyter簡介18
1.6.1 快速安裝與初次使用21
1.6.2 Jupyter魔術命令22
1.6.3 直接從Jupyter Notebook安裝軟件包23
1.6.4 查看新的JupyterLab環境24
1.6.5 Jupyter Notebook怎樣幫助數據科學家24
1.6.6 Jupyter的替代版本29
1.7 本書使用的數據集和代碼30
1.7.1 Scikit-learn小規模數據集30
1.7.2 MLdata.org和其他公共資源庫32
1.7.3 LIBSVM Data樣本33
1.7.4 直接從CSV或文本文件加載數據33
1.7.5 Scikit-learn樣本生成器35
1.8 小結36
第2章 數據改寫37
2.1 數據科學過程37
2.2 使用pandas進行數據加載與預處理39
2.2.1 數據快捷加載39
2.2.2 處理問題數據41
2.2.3 處理大數據集43
2.2.4 訪問其他的數據格式46
2.2.5 合併數據48
2.2.6 數據預處理51
2.2.7 數據選擇55
2.3 使用分類數據和文本數據57
2.3.1 特殊的數據類型―文本59
2.3.2 使用Beautiful Soup抓取網頁64
2.4 使用Numpy進行數據處理65
2.4.1 NmuPy中的N維數組65
2.4.2 NmuPy ndarray對象基礎66
2.5 創建Numpy數組68
2.5.1 從列表到一維數組68
2.5.2 控制內存大小69
2.5.3 異構列表70
2.5.4 從列表到多維數組70
2.5.5 改變數組大小71
2.5.6 利用NumPy函數生成數組73
2.5.7 直接從文件中獲得數組73
2.5.8 從pandas提取數據74
2.6 NumPy快速操作和計算75
2.6.1 矩陣運算77
2.6.2 NumPy數組切片和索引78
2.6.3 NumPy數組堆疊80
2.6.4 使用稀疏數組81
2.7 小結83
第3章 數據科學流程84
3.1 EDA簡介84
3.2 創建新特徵87
3.3 維數約簡89
3.3.1 協方差矩陣89
3.3.2 主成分分析90
3.3.3 一種用於大數據的PCA變型―RandomizedPCA93
3.3.4 潛在因素分析94
3.3.5 線性判別分析94
3.3.6 潛在語義分析95
3.3.7 獨立成分分析95
3.3.8 核主成分分析96
3.3.9 T-分佈鄰域嵌入算法97
3.3.10 受限波爾茲曼機98
3.4 異常檢測和處理99
3.4.1 單變量異常檢測99
3.4.2 EllipticEnvelope101
3.4.3 OneClassSVM104
3.5 驗證指標106
3.5.1 多標號分類107
3.5.2 二值分類109
3.5.3 回歸110
3.6 測試和驗證110
3.7 交叉驗證113
3.7.1 使用交叉驗證迭代器115
3.7.2 採樣和自舉方法116
3.8 超參數優化118
3.8.1 建立自定義評分函數120
3.8.2 減少網格搜索時間121
3.9 特徵選擇123
3.9.1 基於方差的特徵選擇123
3.9.2 單變量選擇124
3.9.3 遞歸消除125
3.9.4 穩定性選擇與基於L1的選擇126
3.10 將所有操作包裝成工作流程127
3.10.1 特徵組合和轉換鏈接128
3.10.2 構建自定義轉換函數130
3.11 小結131
第4章 機器學習132
4.1 準備工具和數據集132
4.2 線性和邏輯回歸134
4.3 樸素貝葉斯136
4.4 K近鄰137
4.5 非線性算法139
4.5.1 基於SVM的分類算法140
4.5.2 基於SVM的回歸算法141
4.5.3 調整SVM(優化)142
4.6 組合策略144
4.6.1 基於隨機樣本的粘貼策略144
4.6.2 基於弱分類器的Bagging策略144
4.6.3 隨機子空間和隨機分片145
4.6.4 隨機森林和Extra-Trees145
4.6.5 從組合估計概率147
4.6.6 模型序列―AdaBoost148
4.6.7 梯度樹提升149
4.6.8 XGBoost150
4.6.9 LightGBM152
4.6.10 CatBoost155
4.7 處理大數據158
4.7.1 作為範例創建一些大數據集158
4.7.2 對容量的可擴展性159
4.7.3 保持速度161
4.7.4 處理多樣性162
4.7.5 隨機梯度下降概述163
4.8 自然語言處理一瞥164
4.8.1 詞語分詞164
4.8.2 詞幹提取165
4.8.3 詞性標注166
4.8.4 命名實體識別166
4.8.5 停止詞167
4.8.6 一個完整的數據科學例子―文本分類168
4.9 無監督學習概覽169
4.9.1 K均值算法169
4.9.2 基於密度的聚類技術―DBSCAN172
4.9.3 隱含狄利克雷分佈173
4.10 小結177
第5章 可視化、發現和結果178
5.1 matplotlib基礎介紹178
5.1.1 曲線繪圖179
5.1.2 繪製分塊圖180
5.1.3 數據中的關係散點圖181
5.1.4 直方圖182
5.1.5 柱狀圖183
5.1.6 圖像可視化184
5.1.7 pandas的幾個圖形示例186
5.1.8 通過平行坐標發現模式191
5.2 封裝matplotlib命令191
5.2.1 Seaborn簡介192
5.2.2 增強EDA性能196
5.3 高級數據學習表示200
5.3.1 學習曲線201
5.3.2 確認曲線202
5.3.3 隨機森林的特徵重要性203
5.3.4 GBT部分依賴關係圖形205
5.3.5 創建MA-AAS預測服務器205
5.4 小結209
第6章 社交網絡分析210
6.1 圖論簡介210
6.2 圖的算法215
6.2.1 節點中心性的類型216
6.2.2 網絡劃分218
6.3 圖的裝載、輸出和採樣221
6.4

您曾經瀏覽過的商品

購物須知

大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。

特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。

無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。

為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。

若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。

優惠價:87 412
海外經銷商無庫存,到貨日平均30天至45天

暢銷榜

客服中心

收藏

會員專區