商品簡介
《對比Excel,輕鬆學習Python統計分析》是“對比Excel”的第4本書,全書依舊突出對比學習的特點,通過對比 Excel 的方式來講解如何利用 Python 學習統計學知識,即統計分析。是“對比 Excel”之前3本書的延續,同時也是數據分析師技能樹的擴展。
《對比Excel,輕鬆學習Python統計分析》的主線是圍繞統計學的理論知識展開的,層層遞進,依次為描述性分析、概率和概率分布、抽樣推 斷與參數估計、假設檢驗、方差分析、卡方分析、回歸模型、相關性分析、時間序列。每個理 論知識又由核心的 3 個部分組成:該理論知識在數據分析中的應用、理論知識講解、Excel 和 Python 工具的實現,讓大家學完本書以後既學到了理論知識,也知道如何將理論知識在數據分 析中應用,還知道如何用 Excel 和 Python 去實現。
作者簡介
張俊紅,某互聯網公司資深數據分析師,暢銷書《對比Excel,輕鬆學習Python數據分析》作者。對比學習法倡導者,入職數據分析師系列叢書作者。喜歡分享,致力於做一個數據科學路上的終身學習者、實踐者、分享者。公眾號“俊紅的數據分析之路”運營人。
名人/編輯推薦
“入職數據分析師系列”叢書暢銷4年,深受讀者好評
總銷量超過20萬冊
《對比Excel,輕鬆學習Python數據分析》
連續三年穩居各大網店暢銷榜前列
出版有繁體版、韓語版
榮獲中國工信出版集團2020年優秀出版物二等獎
榮獲電子工業出版社2020年優秀暢銷書獎
榮獲博文視點公司2019年震撼力圖書獎
序
前言
為什麼要寫作本書
相比Excel、Python 這些數據分析工具,統計學算是數據分析師需要學的門比較偏理論的學科內容。目前市面上關於統計學的圖書主要有如下特點。
? 偏理論型的圖書,更多的是學校教材,而很多分析師又非科班出身,讀起來會相對晦澀難懂;偏科普型的圖書,更多的是講解生活中的一些統計學應用,和數據分析工作不直接相關。
綜合身邊分析師的反饋及筆者本人的一些經驗發現,目前大部分分析師比較需要的圖書是既能夠通俗易懂地講解理論內容,又能夠介紹這些理論內容是如何被應用到數據分析工作中的,並利用Excel 和Python 數據分析工具來實現這些內容。
目前市面上還沒有這樣的書,而筆者又有一些學習經驗。筆者曾經在網上更新統計學系列知識,讀者普遍反映比較通俗易懂,再加上對比學習方法,降低了Python代碼的學習門檻,於是,就有了《對比Excel,輕鬆學習Python 統計分析》這本書。
為什麼要學習統計學
如果大家平常有關注數據分析師的招聘要求,會注意到,大部分招聘信息都會要求熟悉統計學,很多面試官也會問統計學相關的知識。這是因為隨著數據分析專業性的提高,分析師的工作內容需要大量的理論作為支撐,而統計學就是被用得多的理論,所以我們需要學習統計學。
本書寫了什麼
本書的主線是圍繞統計學的理論知識展開的,層層遞進,依次為描述性分析、概率和概率分布、抽樣推斷與參數估計、假設檢驗、方差分析、卡方分析、回歸模型、相關性分析、時間序列。每個理論知識又由核心的3 個部分組成:該理論知識在數據分析中的應用、理論知識講解、Excel 和Python 工具的實現,讓大家學完本書以後既學到了理論知識,也知道如何將理論知識在數據分析工作中應用,還知道如何用Excel和Python 去實現。
本書學習建議
學習本書的主要目的是為了解決實際工作中的問題,所以關於理論知識部分,重點是要理解,而關於工具實現部分,和學習大多數工具一樣,只有多練習,才能熟練掌握。
本書讀者物件
? 已經從事數據分析工作的讀者,想要學習統計學相關知識提高自身專業能力;
? 應屆畢業生及想要轉行成為數據分析師的讀者,需要為面試做準備;
? 產品及運營人員,希望對統計學知識有所了解,方便和數據分析師進行溝通。
本書說明
為了避免內容的重復,關於Python 的安裝及Python 基礎知識,本書不會涉及,如果想要學習,可以閱讀筆者的另一本書《對比Excel,輕鬆學習Python 數據分析》。關於本書用到的數據及代碼資源,可以關注筆者的個人公眾號——俊紅的數據分析之路(ID:zhangjunhong0428),回復關鍵詞“統計學”獲取。
目次
目錄
第1 章 認識統計學 / 1
1.1 統計學是什麼 . 1
1.2 統計學和數據分析有什麼關係 1
1.3 Python 統計學和統計學有什麼區別 . 2
第2 章 描述性分析 / 3
2.1 描述性分析在數據分析中的應用場景 3
2.2 數據類型 . 3
2.3 數據整理與展示 . 3
2.3.1 分類型數據的整理與展示 . 4
2.3.2 數值型數據的整理與展示 . 7
2.4 概括性分析 . 17
2.4.1 集中趨勢指標 . 18
2.4.2 離散程度指標 . 23
2.4.3 分布情況指標 . 25
2.5 其他容易混淆的概念 28
2.5.1 平均值與期望 . 28
2.5.2 比例和比率 . 30
2.5.3 百分比和百分點 . 31
第3 章 概率和概率分布 / 33
3.1 概率和概率分布在數據分析中的應用場景 33
3.2 常見概念 . 33
3.2.1 什麼是隨機事件 . 33
3.2.2 什麼是隨機變量 . 34
3.2.3 什麼是概率 . 34
3.3 離散型隨機變量概率分布 36
3.3.1 概率分布表與概率分布圖 . 36
3.3.2 累積分布函數與百分點函數 . 37
3.3.3 期望與方差 . 37
3.3.4 常見離散型概率分布 . 38
3.4 連續型隨機變量概率分布 46
3.4.1 概率密度與累積分布 . 46
3.4.2 期望與方差 . 50
3.4.3 常見連續型概率分布 . 50
第4 章 抽樣推斷與參數估計 / 65
4.1 抽樣推斷與參數估計在數據分析中的應用場景 65
4.2 抽樣的基本概念 . 65
4.2.1 總體和樣本 . 65
4.2.2 常用統計量 . 66
4.3 常用的抽樣方式 . 66
4.3.1 簡單隨機抽樣 . 67
4.3.2 分層抽樣 . 67
4.4 為什麼樣本可以代表總體 68
4.4.1 中心極限定理 . 68
4.4.2 大數定理 . 70
4.5 參數估計的基本方法 71
4.5.1 點估計 . 71
4.5.2 區間估計 . 72
4.6 區間估計的類型 . 72
4.6.1 一個總體參數的區間估計 . 72
4.6.2 兩個總體參數的區間估計 . 80
第5 章 假設檢驗 / 88
5.1 假設檢驗在數據分析中的應用場景 88
5.2 假設檢驗基本思想 88
5.3 假設檢驗中常見的兩種錯誤 90
5.4 顯著性水平和功效 90
5.5 假設檢驗的基本步驟 91
5.6 一個總體參數的檢驗 94
5.6.1 總體均值的檢驗 . 94
5.6.2 總體比例的檢驗 . 98
5.6.3 總體方差的檢驗 . 99
5.7 兩個總體參數的檢驗 101
5.7.1 兩個總體均值之差的檢驗 . 101
5.7.2 兩個總體比例之差的檢驗 . 106
5.7.3 兩個總體方差比的檢驗 . 107
5.8 假設檢驗中小樣本量的確定 109
5.9 A/B 測試的完整流程 . 111
第6 章 方差分析 / 113
6.1 方差分析在數據分析中的應用場景 . 113
6.2 方差分析的3 個假設 . 113
6.3 正態性檢驗方法 113
6.3.1 直方圖檢驗 113
6.3.2 Q-Q 圖檢驗 114
6.3.3 KS 檢驗 114
6.3.4 AD 檢驗 . 115
6.3.5 W 檢驗 . 116
6.3.6 非正態數據轉換 116
6.4 方差齊性檢驗方法. 118
6.4.1 方差比檢驗 118
6.4.2 Hartley 檢驗 . 118
6.4.3 Bartlett 檢驗 . 119
6.4.4 Levene 檢驗 . 119
6.5 方差分析的基本步驟 120
6.6 方差分析的多重比較 125
6.6.1 LSD 多重比較法 . 125
6.6.2 Sidak 多重比較法 . 127
6.6.3 Bonferroni 多重比較法 . 128
6.7 多因素方差分析 . 129
6.7.1 無交互作用的多因素方差分析 . 129
6.7.2 有交互作用的多因素方差分析 . 134
第7 章 卡方分析 / 140
7.1 卡方分析在數據分析中的應用場景 140
7.2 理論講解 . 140
7.3 Excel 與Python 實現 142
第8 章 回歸模型 / 144
8.1 回歸模型在數據分析中的應用場景 144
8.2 一元線性回歸 . 144
8.2.1 一元線性回歸方程形式 . 144
8.2.2 小二乘參數估計法 . 145
8.2.3 擬合程度判斷 . 147
8.2.4 顯著性檢驗 . 147
8.2.5 Excel 與Python 實現 149
8.3 多元線性回歸 . 151
8.3.1 多元線性回歸方程形式 . 151
8.3.2 小二乘參數估計法 . 151
8.3.3 擬合程度判斷 . 151
8.3.4 顯著性檢驗 . 152
8.3.5 多重共線性 . 153
8.3.6 Excel 與Python 實現 153
8.4 協方差分析 . 155
8.4.1 理論講解 . 155
8.4.2 Excel 與Python 實現 157
第9 章 相關性分析 / 159
9.1 相關性分析在數據分析中的應用場景 159
9.2 相關係數的種類 . 159
9.2.1 皮爾遜相關係數 . 159
9.2.2 斯皮爾曼相關係數 . 162
9.2.3 肯德爾相關係數 . 162
9.2.4 Excel 與Python 實現 163
9.3 相關與因果 . 164
第10 章 時間序列 / 165
10.1 時間序列在數據分析中的應用場景 165
10.2 平穩時間序列預測 . 165
10.2.1 簡單平均法 . 166
10.2.2 移動平均法 . 167
10.2.3 指數平滑法 . 169
10.3 時間序列預測模型 . 172
10.3.1 AR 模型 172
10.3.2 MA 模型 174
10.3.3 ARMA 模型 175
10.3.4 ARIMA 模型 . 176
10.4 時間序列分解預測 . 177
10.5 趨勢時間序列預測 . 187
10.5.1 線性趨勢預測 . 187
10.5.2 指數趨勢預測 . 189
10.5.3 對數趨勢預測 . 191
主題書展
更多書展今日66折
您曾經瀏覽過的商品
購物須知
大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。
特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。
無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。
為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。
若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。