TOP
0
0
即日起~6/30,暑期閱讀書展,好書7折起
Python數據分析從入門到精通(簡體書)
滿額折

Python數據分析從入門到精通(簡體書)

商品資訊

人民幣定價:69 元
定價
:NT$ 414 元
優惠價
87360
領券後再享88折起
海外經銷商無庫存,到貨日平均30天至45天
可得紅利積點:10 點
相關商品
商品簡介
作者簡介
名人/編輯推薦
目次

商品簡介

對於希望使用Python來完成數據分析工作的人來說,學習IPython、Numpy、pandas、Matplotlib這個組合是目前看來不錯的方向。本書就是這樣一本循序漸進的書。本書共3篇14章。第1篇是Python數據分析語法入門,將數據分析用到的一些語言的語法基礎講解清楚,為接下來的數據分析做鋪墊。第2篇是Python數據分析工具入門,介紹了Python數據分析“四劍客”――IPython、Numpy、pandas、Matplotlib。第3篇是Python數據分析案例實戰,包括兩個案例,分別是數據挖掘和玩轉大數據,為讀者能真正使用Python進行數據分析奠定基礎。本書內容精練、重點突出、實例豐富,是廣大數據分析工作者必備的參考書,同時也非常適合大、中專院校師生學習閱讀,還可作為高等院校統計分析及相關專業的教材。

作者簡介

張嘯宇

熱衷於一切計算機技術,在搜狐公司從事數據分析、數據挖掘、深度學習、後端開發等方面的工作。目前計劃做一個Python技術學習交流的網站。

名人/編輯推薦

對於希望使用Python來完成數據分析工作的人來說,學習IPython、Numpy、pandas、Matplotlib這個組合是目前看來不錯的方向。《Python數據分析從入門到精通》就是這樣一本循序漸進的書。

前 言

 

 

由於Python具有簡單、易學、免費開源、可移植性、可擴展性等特點,所以它的受歡迎程度扶搖直上。再加上Python擁有非常豐富的庫,這也使得它在數據分析領域有著越來越廣泛的應用。如果你已經決定學習Python數據分析,但是之前沒有編程經驗,那麼本書將會是你的正確選擇。
本書的第1篇主要介紹學習數據分析必備的一些Python語法基礎,包括Python的安裝、數據類型、數據結構、模塊、類、異常處理、使用pip安裝Python需要的一些工具等;第2篇主要介紹Python在數據處理和科學計算方面的工具和方法,包括IPython交互式殼的使用、Jupyter Notebook的使用和Numpy的使用,還介紹了Python的核心數據分析處理庫pandas,以及Python著名的2D繪圖庫Matplotlib;第3篇通過數據挖掘和玩轉大數據兩個案例總結和應用前面所學的知識。
這三篇的層進正好是Python數據分析入門者的階梯,讀者通過學習這三部分內容,即可邁入數據分析的門檻。
本書的特點
Python是當前非常流行的面向對象編程語言,本書將其在數據分析處理方面的特色發揮到極致。本書的主要特點如下:
? Python被大量應用在數據挖掘和機器學習領域,其中使用極其廣泛的是IPython、Numpy、pandas、Matplotlib等庫。本書詳細地介紹了這些庫的組成與使用,為科學計算相關人員提供了有用的參考資料。
? 本書採取循序漸進的寫作風格,對於工具的安裝、使用步驟、方法技巧逐步展開,加以圖解和應用場景,即使完全不懂Python和數據分析的人員,也可以流暢地讀完本書。
? 無論哪種語言,編程的方法、模式、數據結構、算法都是相通的。本書將科學計算、數據結構與各種工具和方法完美結合,讓非Python讀者也能融會貫通,讓學習統計的人能找到更適合的統計方法和數據分析處理方法。
? 本書最後的兩個實戰案例適合數據分析入門者,案例的步驟詳細、分析到位,能為讀者入手真實項目打下良好的基礎。
本書的內容安排
本書共3篇14章,主要章節規劃如下:
第1章介紹了Python的發展歷程、特性,幫助讀者搭建最基礎的數據分析環境,下載開發語言,選擇開發工具,然後在此基礎上開發自己的第一個Python程序。讀者在學完本章內容後應該對Python有一個基礎的認識,知道為什麼選擇它來進行數據分析。
第2章介紹了Python的基礎語法,包括它的代碼組織形式、如何縮進、如何注釋等,以及輸入/輸出該如何處理,在中文環境下如何更好地使用Python是本章的重點,最後還通過一個實例複習了Python的這些語法。讀者在學完本章內容後可以輕鬆地編寫一些簡單的Python程序。
第3章介紹了Python的數據類型與流程控制語句。如果讀者已有編程基礎,那麼閱讀本章內容不會有任何壓力。如果沒有編程基礎,那麼學習一門語言的流程控制最關鍵的就是這些知識。讀者在閱讀完本章後就能輕鬆閱讀更大的Python程序。
第4章介紹了可複用的函數與模塊。這些內容較為複雜,但卻是進行數據分析的關鍵。每個數據處理過程我們都會用到函數或模塊,而我們後期用到的數據分析庫也可以說是一個大函數。所以學習完本章內容,讀者應該能夠看明白一個完整的Python庫。
第5章介紹了數據結構與算法,這是數據分析的基礎,也是人工智能的基礎。利用算法我們可以找到解決方案,也可以找到最優路徑,還可以更高效地完成數據分析任務。讀者如果沒有看懂本章內容,一定要反復閱讀,直到學會為止。
第6章介紹了面向對象的Python。面向對象已經成為每門語言都具備的特性,類、對象、繼承這些概念都是面向對象的基礎。如果讀者沒有編程經驗,則閱讀本章可能會有一定的難度,但是瞭解了對象的概念,就能學會如何編寫更高效的代碼、如何讓代碼和代碼之間聯動起來。
第7章介紹了異常處理與程序調試。機器畢竟不是人,如果出現錯誤,則可能會導致死機,或者數據出錯。為了防止這些錯誤的發生,或者防止程序的使用方能得到反饋,我們必須學會Python的異常處理功能。並且當程序發生錯誤時,我們還要通過程序調試找到錯誤所在。
第8章介紹了pip軟件包管理。既然在做數據分析時我們要用到很多數據分析庫,那麼如何下載、安裝或管理這些庫就成了數據分析的第一步。pip就是這樣一個工具,它能下載、安裝、更新、顯示、搜索我們需要的數據分析庫。
第9章介紹了IPython科學計算庫,它是使用Python進行數據分析、處理、呈現的重要選擇之一。本章主要介紹了Python科學計算庫的安裝方法、IPython殼的一些特性和基本功能、Jupyter Notebook的安裝和使用方法。IPython殼的使用是本章的重點,也是數據分析處理的基礎工具,希望讀者能夠消化本章內容,為真正做好數據項目打下基礎。
第10章介紹了Numpy科學計算庫,主要介紹了它的數組對象及數組對象的一些基本屬性和生成數組的基本方法,還包括數組的索引和分片等基本操作,這部分內容是Numpy數據處理的核心。本章介紹的代數運算函數、線性代數、統計函數等內容會讓讀者覺得有些困惑,但這已經進入了數據分析的關鍵時刻,所以仍建議讀者對本章的內容融會貫通。
第11章介紹了pandas數據分析處理庫,主要包括它的序列、數據框的基本操作,還包括pandas裡處理默認值、讀取常見格式的文本數據,以及數據的組合和分組操作。最後介紹了pandas的時間序列和一個處理實際數據集的案例,讀者掌握了這些內容,就可以更好地處理數據。
第12章介紹了Matplotlib的Pyplot和Artist模塊,以及pandas的繪圖功能。對於讀者來說,Pyplot模塊是需要掌握的,Artist模塊是需要瞭解的,pandas的繪圖功能在實際數據分析中要能熟練應用。
第13章是數據挖掘的案例。首先介紹了著名的貝葉斯理論,然後實現了貝葉斯分類器,最後實現了協同過濾算法,這些都是數據挖掘、分析領域的基礎算法。建議讀者嘗試自己編寫代碼,熟練掌握貝葉斯分類器和協同過濾算法的使用。
第14章是玩轉大數據的案例。鑒於本書主要針對數據分析入門者,所以本章也逐步實現了數據的分析過程,從瞭解數據到分析數據,最後到代碼實現,相信讀者學完本章內容後,就能真正動手分析大數據了。
本書由淺入深、從理論到實踐,尤其適合初學者逐步學習和完善自己的知識結構。
適合閱讀本書的讀者
? 希望從事數據分析相關工作的人員。
? 數據分析工作人員。
? 大數據從業人員。
? Python愛好者。
? 人工智能從業人員。
? 統計行業的人員。
? 大、中專院校統計相關專業的學生。

目次

第1篇 Python數據分析語法入門
第1章 初識Python 1
1.1 Python是什麼 2
1.2 Python有什麼優點 3
1.2.1 Python是自由開源的軟件 3
1.2.2 Python是跨平臺的 3
1.2.3 Python功能強大 4
1.2.4 Python是可擴展的 4
1.2.5 Python易學易用 5
1.3 其他程序設計語言中的Python 5
1.3.1 Jython 5
1.3.2 Python for .NET 6
1.3.3 IronPython 6
1.4 快速搭建Python開發環境 7
1.4.1 Python的下載和安裝 7
1.4.2 用Visual Studio編譯Python源代碼 9
1.4.3 Python開發工具:Vim 10
1.4.4 Python開發工具:Emacs 15
1.4.5 Python開發工具:PythonWin 18
1.4.6 其他的Python開發工具 20
1.5 第一個Python程序 22
1.5.1 從“Hello, Python!”開始 22
1.5.2 Python的交互式命令行 24
1.6 本章小結 25
第2章 Python起步必備 27
2.1 Python代碼的組織形式和注釋方式 27
2.1.1 用縮進來分層 28
2.1.2 代碼的兩種注釋方式 29
2.1.3 Python語句的斷行 30
2.2 Python的基本輸入/輸出函數 31
2.2.1 接收輸入的input()函數 31
2.2.2 輸出內容的print()函數 32
2.3 Python對中文的支持 33
2.3.1 Python 3之前的版本如何使用中文 33
2.3.2 更全面的中文支持 36
2.4 簡單實用的Python計算器 37
2.4.1 直接進行算術運算 37
2.4.2 math模塊提供豐富的數學函數 38
2.4.3 Python對大整數的支持 39
2.5 本章小結 40
第3章 Python的數據類型與流程控制語句 41
3.1 Python數據類型:數字 42
3.1.1 整型和浮點型 42
3.1.2 運算符 43
3.2 Python數據類型:字符串 45
3.2.1 Python中的字符串 45
3.2.2 字符串中的轉義字符 46
3.2.3 操作字符串 46
3.2.4 字符串的索引和分片 49
3.2.5 格式化字符串 50
3.2.6 字符串、數字類型的轉換 50
3.2.7 原始字符串 51

3.3 Python數據類型:列表和元組 52
3.3.1 創建和操作列表 52
3.3.2 創建和操作元組 53
3.4 Python數據類型:字典 54
3.5 Python數據類型:文件 55
3.6 Python數據類型:布爾值 56
3.7 Python的流程控制語句 56
3.7.1 分支結構:if語句 57
3.7.2 循環結構:for語句 59
3.7.3 循環結構:while語句 62
3.8 本章小結 63
第4章 可複用的函數與模塊 64
4.1 Python自定義函數 65
4.1.1 函數的定義 65
4.1.2 函數調用 66
4.2 參數讓函數更有價值 67
4.2.1 有默認值的參數 67
4.2.2 參數的傳遞方式 69
4.2.3 如何傳遞任意數量的參數 70
4.2.4 用參數返回計算結果 70
4.3 變量的作用域 71
4.4 最簡單的函數:使用lambda表達式定義函數 72
4.5 可重用結構:Python模塊 73
4.5.1 Python模塊的基本用法 73
4.5.2 Python在哪裡查找模塊 75
4.5.3 是否需要編譯模塊 77
4.5.4 模塊也可獨立運行 78
4.5.5 如何查看模塊提供的函數名 79
4.6 用包來管理多個模塊 80
4.6.1 包的組成 80
4.6.2 包的內部引用 81
4.7 本章小結 81
第5章 數據結構與算法 82
5.1 表、棧和隊列 82
5.1.1 表 83
5.1.2 棧 84
5.1.3 隊列 86
5.2 樹和圖 88
5.2.1 樹 88
5.2.2 二叉樹 89
5.2.3 圖 93
5.3 查找與排序 95
5.3.1 查找 96
5.3.2 排序 97
5.4 本章小結 100
第6章 面向對象的Python 101
6.1 面向對象編程概述 101
6.1.1 Python中的面向對象思想 102
6.1.2 類和對象 102
6.2 在Python中定義和使用類 103
6.2.1 類的定義 104
6.2.2 類的使用 105
6.3 類的屬性和方法 106
6.3.1 類的屬性 107
6.3.2 類的方法 108
6.4 類的繼承 111
6.4.1 使用繼承 111
6.4.2 Python的多重繼承 112
6.5 在類中重載方法和運算符 114
6.5.1 方法重載 114
6.5.2 運算符重載 115
6.6 在模塊中定義類 117
6.7 本章小結 119

第7章 異常處理與程序調試 120
7.1 異常的處理 120
7.1.1 使用try語句捕獲異常 121
7.1.2 常見異常的處理 123
7.1.3 多重異常的捕獲 124
7.2 用代碼引發異常 125
7.2.1 使用raise語句引發異常 126
7.2.2 assert——簡化的raise語句 127
7.2.3 自定義異常類 128
7.3 使用pdb模塊調試Python腳本 128
7.3.1 調試語句塊 129
7.3.2 調試表達式 129
7.3.3 調試函數 130
7.3.4 設置斷點 131
7.3.5 pdb調試命令 131
7.4 在PythonWin中調試腳本 134
7.5 本章小結 136
第8章 pip軟件包管理 137
8.1 安裝pip 137
8.2 更新pip 138
8.3 pip常用操作 138
8.3.1 安裝軟件包 138
8.3.2 卸載軟件包 139
8.3.3 更新軟件包 139
8.3.4 顯示本地所有已經安裝的軟件包 139
8.3.5 顯示軟件包的細節 139
8.3.6 搜索軟件包 140
8.3.7 通過wheel文件安裝軟件包 141
8.4 本章小結 141
第2篇 Python數據分析工具入門
第9章 IPython科學計算庫 142
9.1 IPython簡介 143
9.2 安裝IPython及其他相關庫 144
9.2.1 使用Anaconda安裝 144
9.2.2 使用pip安裝 145
9.3 IPython殼基礎 146
9.3.1 自動補全 147
9.3.2 檢查 149
9.3.3 %run命令 150
9.3.4 快捷鍵 150
9.3.5 異常和錯誤定位 151
9.3.6 魔法方法 151
9.3.7 和操作系統交互 152
9.3.8 代碼分析:%prun和%run 153
9.3.9 目錄標簽系統 155
9.3.10 嵌入IPython 155
9.4 融合Matplotlib庫和Pylab模型 156
9.5 輸入和輸出變量 157
9.6 交互式調試器 158
9.7 計時功能 159
9.8 重新載入模塊 160
9.9 配置IPython 161
9.10 Jupyter 162
9.10.1 基於Qt的控制台 162
9.10.2 Jupyter Notebook 165
9.11 IPython和Jupyter Notebook的關係 170
9.12 本章小結 173
第10章 Numpy科學計算庫 174
10.1 Numpy基礎 174
10.1.1 數組對象介紹 175
10.1.2 生成數組 176
10.1.3 數組對象數據類型 180
10.1.4 打印數組 182
10.2 數組的基本操作 184
10.3 基本的分片和索引操作 186
10.4 高級索引 189
10.4.1 整數索引 189
10.4.2 布爾索引 190
10.4.3 布爾索引的簡單應用 192
10.5 改變數組的形狀 193
10.6 組裝、分割數組 195
10.7 數組的基本函數 196
10.8 複製和指代 198
10.9 線性代數 199
10.10 使用數組來處理數據 201
10.11 Numpy的where()函數和統計函數 203
10.11.1 where()函數 203
10.11.2 統計函數 205
10.12 輸入與輸出 206
10.12.1 二進制文件 206
10.12.2 文本文件 207
10.13 生成隨機數 208
10.14 數組的排序和查找 210
10.14.1 排序 210
10.14.2 查找 212
10.15 擴充轉換 213
10.16 本章小結 215
第11章 pandas數據分析處理庫 216
11.1 pandas數據結構介紹 217
11.1.1 序列 217
11.1.2 數據框 221
11.2 索引對象 226
11.3 核心的基本函數 227
11.4 索引和旋轉 229
11.5 算術運算與對齊 232
11.6

您曾經瀏覽過的商品

購物須知

大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。

特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。

無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。

為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。

若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。

優惠價:87 360
海外經銷商無庫存,到貨日平均30天至45天

暢銷榜

客服中心

收藏

會員專區