商品簡介
研究、報告、工作的好幫手,
用明確的機率代替模糊假設,
醫學、工業、經濟、企業管理科系最佳自學讀物!
本書預設的讀者為:
・準備開始接觸貝氏統計學
・不了解一般統計學與貝氏統計學差異,感到困擾
・理工科系的高中生、大學生
只要具備高中程度的數學能力,人人都能學!
一般統計學和貝氏統計學有什麼不一樣?
為什麼理工科系經常需要用到?
貝氏統計學先根據常識、經驗建立假設,又被稱為「積極正向」的統計學。
學好貝氏統計,學業、工作更有效率!
作者簡介
高橋信
1972年生於日本新潟縣,畢業於九州藝術工科大學(現為 九州大學)研究所,專攻藝術工學研究科資訊傳達。曾從事數據分析業務及研討會講師,現為作家。
譯者簡介
衛宮紘
清華大學原子科學院學士班畢。現為自由譯者。譯作有《上司完全使用手冊》(東販)、《超慢跑入門》(商周)、《男人懂了這些更成功》(潮客風)、《世界第一簡單電力系統》(世茂)……等。
審訂者簡介
洪萬生
美國紐約城市大學(CUNY)科學史博士,國立台灣師範大學數學系學士、碩士。國立台灣師範大學數學系教授兼主任(2007/8/1-2009/7/31)、台灣數學教育學會理事長(2007-2009)、國際科學史學院通訊會員、Historia Mathematica(國際數學史雜誌)編輯委員、《HPM通訊》發行人、台灣數學(虛擬)博物館創始人之一。
序
本書是講解貝氏統計學的書籍。
本書預設的讀者為:
・準備開始接觸貝氏統計學
・不了解一般統計學與貝氏統計學差異,感到困擾
・想要攻讀大學理工科系的高中生
想要順利閱讀本書並不難,具備高中程度數理知識即可。
一般統計學又稱為古典統計學或者常識統計學,稱法因人而異,即便沒有統計學方面知識,對閱讀本書不至於會造成太大影響。
本書章節分為:
・第1章 什麼是貝氏統計學?
・第2章 基本知識
・第3章 概度函數
・第4章 貝氏定理
・第5章 馬可夫鏈蒙地卡羅法
・第6章 馬可夫鏈蒙地卡羅法的應用
前面四個章節並不困難,從第5章開始則會相對變得比較困難。
原則上,每個章節皆分為:
・漫畫部分
・補充漫畫的文字部分
一些章節沒有文字補充說明,在安排上已盡量讓讀者不須額外閱讀文字,閱讀漫畫即能銜接後面章節。
本書詳細列出計算過程,擅長數學的讀者可以仔細研讀一番;不擅長或者沒有閒暇時間的讀者大致瀏覽即可,「只要依照步驟進行,就能求得答案」,心裡有底就行了,不必勉強自己讀過一次即能了解透徹,一步一腳印慢慢吸收吧。但必須至少瀏覽全書一次,建立基本概念。
在這邊,我想感謝惠予執筆機會的歐姆社股份有限公司,尤其是從第一本著作《世界第一簡單統計學》接續負責本作拙稿的津久井靖彥編輯,想致上深深的謝意。最後,我還要感謝盡力將原稿改編成漫畫的上地優步先生以及Verte股份有限公司。
2017年11月
高橋 信
目次
序
序 想要學貝氏統計學!
第1章 什麼是貝氏統計學?
1. 貝氏統計學
2. 一般統計學與貝氏統計學的差異
第2章 基本知識
1. 期望值、變異數與標準差
1.1 期望值
1.2 變異數與標準差
2. 機率分布
2.1 均勻分布
2.2 二項分布
2.3 多項分布
2.4 均勻分布
2.5 常態分布
2.6 t分布
2.7 逆伽瑪分布
3. 其他機率分布
3.1 負二項分布
3.2卜瓦松分布(Poisson distribution)
3.3 指數分布
3.4 貝他分布
第3章 概度函數
1. 概度
1.1 大數法則
1.2 KL散度
1.3 概度
2. 概度函數
2.1 多項分布的概度函數
2.2 常態分布的概度函數
3. 其他的概度函數
3.1 二項分布的概度函數
3.2卜瓦松分布的概度函數
第4章 貝氏定理
1. 貝氏定理
1.1 條件機率
1.2 聯合機率
1.3 貝氏定理
1.4 具體例子
2. 事前機率密度函數與事後機率密度函數
第5章 馬可夫鏈蒙地卡羅法
1. 蒙地卡羅積分
1.1 蒙地卡羅積分
1.2 連續型隨機變數的期望值與變異數
2. 馬可夫鏈
2.1 馬可夫鏈
2.2 不變分布
3. 馬可夫鏈蒙地卡羅法
3.1馬可夫鏈蒙地卡羅法
3.2 Metropolis−Hastings演算法
3.3 吉布斯抽樣法
4. 自然共軛事前分布
第6章 馬可夫鏈蒙地卡羅法的應用
1. 兩母群體的平均數推測
1.1 統計的假設檢定
1.2 假設檢定的步驟
1.3 假設檢定的種類、虛無假設與對立假設
1.4 實例
2. 層級貝氏模型
附錄
1. 事前分布的前提條件與事後分布
2. 收斂的判斷
2.1 Geweke法
2.2 Gelman−Rubin法
索引 148
書摘/試閱
1.1 統計的假設檢定
統計的假設檢定(以下簡稱假設檢定)是指,由樣本數據推測
・「就讀東京都私立大學外宿生」與「就讀福岡縣私立大學外宿生」的每月平伙食費應該不同?
・「投予抗癌劑 的肺癌末期患者」與「投予抗癌劑 的肺癌末期患者」的生存率應該不同?
分析者建立的母群體假設是否正確的分析方法總稱。分析方法有下面這幾種:
・母體平均數差異檢定
・無相關檢定
・獨立性檢定
・單因子變異數分析
1.2 假設檢定的步驟
不論是母體平均數差異檢定還是其他檢定,假設檢定的步驟都是相同的。這邊整理成下表註:
Step1 定義母群體
Step2 建立虛無假設與對立假設。
Step3 選擇一種假設檢定。
Step4 給定顯著水準。
Step5 由樣本數據求算檢定統計量
Step6 比較Step5檢定統計量所對應的 值是否小於顯著水準。
Step7 若 值小於顯著水準,則「對立假設為真」,「拒絕」虛無假設;否則「無法推翻虛無假設」,「接受」虛無假設。
順便一提,上表的步驟可簡化成下頁①和②兩個階段。
① 將樣本數據代入公式,算出其中一個值。公式會因不同的假設檢定有所差異。
1. 變數1
2. 變數2
3. A先生
4. B先生
5. 代入
6. 算出
② 若①數值所對應的 值小於顯著水準,則「對立假設為真」,「拒絕」虛無假設;否則「無法推翻虛無假設」,「接受」虛無假設。
7. 值 顯著水準
8. 對立假設為真
9. 值 顯著水準
10. 無法推翻
虛無假設
1.3 假設檢定的種類、虛無假設與對立假設
各種假設檢定有其對應的虛無假設與對立假設,下表為其中的兩個例子。
1. 母體平均數差異檢定
2. 單因子變異數分析
3. 虛無假設
4. 對立假設
5. 非
6. 非
在做假設檢定時,需要根據自身提出的猜測,建立適當的虛無假設與對立假設。這樣一說,有些人會覺得很困難吧,但不論是誰來做,分析者建立假說的方式大致固定,一般常見的假設檢定都有套路可依循,很少碰到煩惱怎麼做的情況。
需要注意的地方有兩點。
第一,母體平均數差異檢定的對立假設,嚴格來說,「非 」應為下面三者之一:
・
・
・
原則上,分析者在收集數據「之前」,必須先選定其中一種。
第二,單因子變異數分析的對立假設,跟母體平均數差異檢定不同,只有上表中的一種,但需要另外注意它擁有多重意義:
・
・
・
也就是得留意它包含了其他複數的假設。
1.4 實例
問題
東京都、福岡縣皆有熱鬧的街道,但後者的物價相對便宜。因此,△△報社提出這樣的假設:就讀福岡縣私立大學外宿生的每月平均伙食費比較少。
為了驗證假設正不正確,△△報社在2017年10月,隨機抽樣就讀東京都、福岡縣私立大學外宿生各25人,調查他們的每月平均伙食費:
令「第 位抽出外宿生的每月平均伙食費」的 和 為
・
・
(1)試以一般統計學的母體平均數差異檢定推測是否 。假設顯著水準為0.05。
(2)試以貝氏統計學推測是否 。
解答(1)如同下表:
定義母群體。
母群體為
・就讀東京都私立大學外宿生整體
・就讀福岡縣私立大學外宿生整體
建立虛無假設與對立假設。
虛無假設為「 」。
對立假設為「 」。
選擇一種假設檢定。
選擇母體平均數差異檢定。
給定顯著水準。
令顯著水準為0.05。
由樣本數據求算檢定統計量。
執行母體平均數差異檢定。
假設 ,這題的檢定統計量值為
若此實例的虛無假設為真,則檢定統計量符合自由度48的 分布。
比較Step5檢定統計量所對應的 值是否小於顯著水準。
顯著水準為0.05,統計檢定量1.7053所對應的 值為0.0473。因為 ,所以 值比較小。
若 值小於顯著水準,則「對立假設為真」,「拒絕」虛無假設;否則「無法推翻虛無假設」,「接受」虛無假設。
值小於顯著水準,因此,對立假設「 」為真,拒絕虛無假設。
(2)下表為根據159~170頁的說明所計算出來的結果,東京都的部分是直接轉用167~170頁的數據。
95%信賴區間
事後中位數
事後期望值
事後變異數
求算 的機率,由上表可知 為
亦即 的機率為0.9421。
1. 若是貝氏統計學,
比如…
2. 的機率,
馬上就能求出來。
3.
貝氏統計學
簡單又便利!
順便一提,
剛才的例子會是…
主題書展
更多書展今日66折
您曾經瀏覽過的商品
購物須知
為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。
若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。