一次搞懂統計與分析:大數據時代的必勝競爭力
商品資訊
商品簡介
這本書不用數學公式 ,而是用通俗易懂的語言,介紹統計和分析技術,不論在企業界、科學界,或其他領域,你都需要學會統計與分析!
新版本增加了三個了討論分析的全新章節,讓你可以從任何規模的資料庫中發現模式——這套方法甚至可以用在大數據上。本書提供最新的例子和問題,讓你可以親手練習。
附錄有使用Microsoft Excel解題的詳細說明,如果你喜歡數學,「公式黑板」單元會解釋解題技巧的數學基礎。如果你喜歡使用TI-83/84計算機,也有單元會教你如何使用它解題。
你將學會:
利用最新版本的Microsoft Excel,精通統計和分析的工具(包括Mac和PC)。
平均數、中位數、標準差、Z分數、偏態等敘述性統計。
使用機率,機率分布,抽樣分布和信賴區間。
利用Z、T、卡方、變異數分析(ANOVA)和其他技術進行假設檢定。
執行強大的迴歸分析和建模,包括多元迴歸。
了解分析,包括它的概念、術語、方法、能力和局限。
應用預測分析,預測可能的近期成果。
本書提供網站,讓你下載練習文件、模板、資料庫和範例試算表,包括可以立即為你解決問題的工具!(網址:www.ftpress.com/evenyoucanlearnstatistics3e)
作者簡介
作者簡介
大衛‧勒凡是紐約市立大學柏魯克分校(Baruch College-CUNY)統計與電腦資訊系統榮譽教授,他擁有紐約市立大學B.B.A.和MBA學位,以及紐約大學工業工程與作業研究的博士學位。他是全美商業統計教育的領先創新者,是《寫給管理者的基礎商業統計學》(Statistics for Managers Using Microsoft Excel, Basic Business Statistics: Concepts and Applications, Business Statistics: A First Course)以及《工程與科學的應用統計學:使用Microsoft Excel與Minitab》(Applied Statistics for Engineers and Scientists Using Microsoft Excel and Minitab)等暢銷統計教科書的共同作者。
萊溫曾在Psychometrika, The American Statistician, Communications in Statistics, Multivariate Behavioral Research, Journal of Systems Management, Quality Progress以及The American Anthropologist等期刊發表過許多文章,也曾在American Statistical Association, Decision Sciences Institute以及Making Statistics More Effective in Schools of Business等論壇上發表演說。萊溫因教學傑出在紐約市立大學柏魯克分校多次獲獎。
大衛‧史蒂芬是一位獨立的教學技術專家,在紐約市立大學柏魯克分校擁有超過二十年的教學經驗,率先使用具有電腦的教室以及跨學科的多媒體工具。他是美國教育部FIPSE專案(原名「改善中學後教育的基金」)的副主任,該專案旨在商業環境中,以互動媒體支援電腦應用的教學。
史蒂芬經常參與Making Statistics More Effective in Schools of Business的迷你論壇,也是《商業統計學》(Business Statistics: A First Course and Statistics for Managers Using Microsoft Excel)一書的作者。他也是PHStat的共同開發者,PHStat是一套Microsoft Excel的統計外掛程式。
譯者簡介
游懿萱
輔仁大學翻譯學研究所碩士,目前就讀台灣師範大學翻譯研究所博士班。現任實踐大學兼任講師,並任教於各大英語補習班。曾獲第一屆林語堂文學翻譯獎佳作。著有《會話王:交通通訊》、《會話王:衣著外表》系列、《全民英檢初級寫作能力測驗》、佳音英語翰將系列講義與測驗卷(合著)。譯有《自私的巨人》、《達文西機械》、《小口瓶的藝術》、《TOEFL iBT階段式托福寫作》、《究極英單12000 [2], [3], [4]》、《美麗的真相:寶拉教你破解138個「保養+醫學美容」迷思》(合譯)、《這輩子我該怎麼過:超能靈媒教你從生命彩光中找出天命》、《中年不敗:永保魔力的中年生活指南》等書。
李立心
台大財金系畢業,現為臺大中英翻譯碩士學位學程口譯組學生。譯有《一擊奏效的社群行銷術》。
目次
本書使用說明
第一章 統計學的基本概念
第一節 統計學中首要的三個詞
第二節 參數與統計量
第三節 統計學的分支
第四節 資料來源
第五節 抽樣概念
第六節 樣本選擇方式
第二章 利用圖表呈現資料
第一節 呈現類別變數
第二節 呈現數值變數
第三節 「不佳」的圖表
第三章 描述型統計
第一節 趨中量數
第二節 位置量數
第三節 變異量數
第四節 分配圖形
第四章 機率
第一節 各種事件
第二節 更多定義
第三節 一些機率規則
第四節 機率測度的方法
第五章 機率分配
第一節 離散變數的機率分配
第二節 二項與卜瓦松機率分配
第三節 連續機率分配與常態分配
第四節 常態機率圖
第六章 抽樣分配與信賴區間
第一節 基本概念
第二節 抽樣誤差與信賴區間
第三節 利用t分配估計平均(標準差σ未知)信賴區間
第四節 類別變數的信賴區間估計
第五節 拔靴法估計
第七章 假設檢定的基本概念
第一節 虛無與對立假設
第二節 假設檢定的問題
第三節 決策風險
第四節 進行假設檢定
第五節 假設檢定的類型
第八章 假設檢定:Z檢定與t檢定
第一節 兩占比差檢定
第二節 兩自變數群的均差檢定
第三節 雙尾t檢定
第九章 假設檢定:卡方檢定與單因子變異數分析
第一節 雙向交叉分類表之卡方檢定
第二節 單因子變異數分析(ANOVA):檢測兩組以上變數之均差
第十章 簡單直線迴歸
第一節 基礎迴歸分析
第二節 建立簡單直線迴歸模型
第三節 變異量數
第四節 推論斜率推論
第五節 迴歸分析常見錯誤
第十一章 多元迴歸
第一節 多元迴歸模型
第二節 多元判定係數
第三節 整體F檢定
第四節 多元迴歸模型的殘差分析
第五節 母體統計推估
第十二章 解析學的基本概念
第一節 統計分析的基本單字
第二節 統計分析軟體
第十三章 描述型解析
第一節 儀表板
第二節 常見的描述型分析圖表
第十四章 預測型解析
第一節 統計分析之預測分析
第二節 分類與迴歸樹
第三節 叢聚分析(Cluster Analysis)
第四節 多維標度法
附錄A Microsoft Excel的操作與配置
S1試算表操作慣用語
S2試算表技術配置
附錄B 算數與代數複習
評量測驗
符號
測驗解答
附錄C 統計附表
附錄D 試算表技巧
製圖技巧
FT:函數技巧
附錄E 進階技巧
進階操作方式
分析工具箱技巧
附錄F 可下載檔案文件
F.1 可下載的數據檔案
F.2 可下載圖表解題檔案
相關術語解釋
中英對照表
書摘/試閱
你已經知道統計學與分析事物有關。雖然數字在本章開頭用來代表事物,但統計學中首要的三個詞:母體、樣本、變數,能夠讓你更了解運用統計學所分析的事物。
母體
觀念:你所研究的群體總量。
範例:所有具有投票權的美國公民、去年在某間醫院中接受治療的所有病人、在某天當中瀏覽某個網站的所有人。
樣本
觀念:母體中被挑選出來作分析的部分。
範例:接受下次選舉意向調查的選民、被選出來填寫病人滿意度問卷的病人、從工廠生產線中挑出的100盒早餐穀片、在某天中瀏覽某個網頁的其中500人。
變數
觀念:將要運用統計學來分析的某項物品或人物特色。
範例:性別、某位選民的政黨傾向、住在某個地理區人民的家庭收入、圖書分類(精裝、貿易平裝版、大眾平裝版、教科書)、某個家庭中擁有的手機數量。
說明:所有的變數形成了分析的數據。雖然大家常說他們在分析資料,但精確地說,他們分析的其實是變數。
你必須將變數獨立出來,例如性別,以及這個變數對應某人的值,例如男性。觀察樣本當中特定對象的所有數值。例如一項調查可能同時包含了性別與年齡兩個變數。第一位觀察對象很可能是40歲的男性,第二位則是55歲的女性。在繪製表格時,通常會將某個變數的待分析數值放在同一欄。因此,有些人會將變數稱為「資料欄」。同樣的,有些人會將觀察對象稱為「資料列」。
第二節 參數與統計量
在你知道要分析的是什麼之後,或是用前述的詞彙來說,在你從母體或研究樣本中找出變數之後,就能夠定義你分析內容中的「參數」與「統計量」。
參數
觀念:母體當中描述一個變數(特徵)的數值量測值。
範例:所有願意在下次選舉中投票的選民比例,所有對接受的醫療照護感到滿意的病人比例,在某天當中某個網站所有訪客停留時間的平均值。
統計量
觀念:樣本當中描述一個變數(特徵)的數值量測值。
範例:願意在下次選舉中投票的樣本選民比例、對接受的醫療照護感到滿意的樣本病人比例、在某天某個網站樣本訪客停留時間的平均值。
說明:計算某個樣本的統計量是最常見的活動,因為在作決策時,要蒐集母體的資料是不切實際的作法。
第三節 統計學的分支
你可以運用參數或統計量來描述變數或是針對資料下結論。這兩種用途定義了統計學的兩個分支:「描述型統計」(descriptive statistics)與「推論統計(inferential statistics) 」。
描述型統計
觀念:著重在蒐集、總結、呈現一組資料的統計學分支。
範例:某地區市民的年齡平均值、所有統計學書籍的平均長度、訪客造訪一個網站的時間變化量。
說明:你應該最熟悉統計學的這個分支,因為日常生活當中的相關實例多到不勝枚舉。許多領域皆以描述型統計作為分析與討論的依據,例如證券交易、社會科學、政府機構、健康科學、職業運動等等。由於資料容易計算與取得,描述型的方式看似相當容易,但這種看來容易的方式並非全無缺點,本書會在第二章與第三章中針對這點進行說明。
推論統計
觀念:分析樣本資料以針對母體作出結論的統計學分支。
範例:針對1,246位女性樣本進行的調查,結果發現有45%的人認為朋友或家人能夠在購物時提供可信的建議;只有7%的人認為廣告能在購物時提供可信的建議。利用本書第六章第四節中提到的方式,你就能夠利用這些統計量來對所有的女性母體作出結論。
說明:在運用推論統計時,會從建立假設開始,接著檢視這些資料是否與假設一致。這種進一步的分析意味著推論統計方法很容易遭到誤用與誤解,許多推論統計也必須透過計算工具或程式才能完成(本書第六章至第九章提到了你最容易遇到的推論統計方法)。
第四節 資料來源
每次進行統計學分析時,都必須蒐集資料,也就是找出你要運用的資料來源。重要的資料來源包括了「公開資訊」、「實驗」、「調查」。
公開資訊
觀念:印刷品或電子資料,包含了在網站上找到的資料。第一手資料指的是個人或團體蒐集且出版的資料;第二手資料則是將第一手資料編纂整理而成的資料。
範例:許多美國的聯邦機構,包括了美國人口調查局,他們會把第一手資料公布在「www.fedstats.gov」網站上。個別產業團體或商業新聞網站通常都會在網站上,或是以書面的方式提供第二手資料,這些多半是彙編商業組織與政府機構的資料而來。
說明:在使用這些資料時,你必須考慮出版機構與資料是否有所偏頗,在發布資料時是否包含了所有必要且相關的變數。在使用網路上蒐集而來的資料時,特別需要注意這一點。
實驗
觀念:僅改變另一個或數個變數的值,並維持其他條件不變,以檢驗某個變數影響的研究方式。典型的實驗包含了實驗組與對照組。實驗組當中包含了接受實驗或治療的個人、物品。對照組則包含了未接受實驗或治療的個人、物品。
範例:藥廠透過實驗來判定某項新藥物是否有效。一群具有相同特徵的病患會被分為兩組。其中一組,亦即實驗組,會接受新藥的治療;另外一組,亦即對照組,則通常僅服用沒有療效的安慰劑。在一段時間之後,再比較兩組的統計數字。
說明:適當的實驗方式包括了「單盲實驗」與「雙盲實驗」。「單盲實驗」意味著僅有操作實驗的人員知道實驗組與對照組的差別。如果操作實驗者與受試者皆不知道誰是實驗組,誰是對照組,則這種實驗方式即稱為「雙盲實驗」。
在利用安慰劑進行實驗時,研究人員也必須將安慰劑效應納入考量,亦即對照組的受試者是否因為相信自己服用了有效的藥物,因而使病情好轉。
如果對照組好轉的程度與實驗組相同,研究人員就能判定安慰劑效應對兩組皆造成重要的影響。
調查
觀念:利用問卷或類似方式蒐集一群參與者回應的值。
範例:美國十年一次的書面人口普查、選舉的民調、網路即時投票或是「每日票選」。
說明:調查的方式包括「非正式調查」,亦即任何有意願者皆可參加,以及「特定目標調查」,亦即針對特定團體或個人進行的調查;或是「隨機抽樣的調查」。調查的類型會影響資料蒐集、運用、說明的方式。
第五節 抽樣概念
在前述的統計量定義中,你得知計算樣本的統計量是最常見的活動,因為蒐集母體資料通常過於不切實際。由於抽樣的方式相當常見,因此你必須了解母體當中組成分子的概念,以及說明如何採取樣本。
組織體
觀念:母體中所有組成分子的清單,樣本即從這些清單當中取出。
範例:選舉人名冊,市公所不動產紀錄、客戶或人資資料庫、索引目錄等。
說明:組織體會影響分析的結果。採用不同的組織體可能會造成不同的結果。因此你必須仔細確認組織體能夠完全代表一個母體;否則的話,以任何方式抽樣都會造成偏頗,分析這些樣本的結果也會不精確。
抽樣
觀念:從母體中選出一個樣本的過程。
範例:從每五位離開投票所的選舉人中找出一位進行訪談、從一副牌中隨機抽取一張牌、針對今天每十位造訪某網站的訪客進行調查。
說明:有些抽樣方式,例如網站上的「即時投票」,往往並非從健全的組織體當中抽樣。從健全組織體中抽樣的技巧,稱為「機率抽樣」。
機率抽樣
觀念:將選取每樣物件的機率納入考量的抽樣過程。機率抽樣能夠提升母體當中樣本的代表性。
範例:被選出來參加下次選舉意向調查的登記選民、被選出來填寫服務滿意度問卷的病患、從工廠生產線當中選出的100盒早餐穀片。
說明:你必須盡可能採用機率抽樣的方式,因為只有這種抽樣方式能夠讓你在搜集來的資料上運用推論統計的方式。相較之下,在每個單一事件發生機率不明時,若要以低成本的方式進行初步或實驗性質的研究,之後會再以嚴謹的方式分析時,則應採用非機率抽樣的方式。歡迎大眾自行來電投票,或是在網路上開放大眾填寫的問卷,皆屬於非機率抽樣。
簡單隨機抽樣
觀念:在機率抽樣的過程當中,母體中的每個人或每樣物件與其他人或其他物件被選中的機率相等。某個數量中的可能樣本被選中的機會,與另一個同樣數量中樣本被選中的機會相同。
範例:利用統計學的方式,例如亂數表,從洗過的一副牌中抽取一張牌。
說明:簡單隨機抽樣是其他隨機抽樣方式的基礎。在這個詞彙當中,隨機的意思必須特別說明。這個詞彙中的隨機指的是沒有重複的模式,意即沒有特定的順序,或是某種排列方式很可能或很不可能出現,和我們一般所謂的「意料之外」或「沒料想到」(如:意外的善意行為)的意思完全不同。
其他機率抽樣方式
觀念:在調查抽樣時,也會使用其他較複雜的抽樣方式。在分類樣本當中,組織體中的物件會先細分為數個次母體,或是數個階層,再從每個階層當中隨機抽樣。在一群樣本當中,組織體內的物件會先分為幾群,讓每一群都能代表整個母體,隨後進行隨機抽樣,接著再針對每群中選出的物件或樣本進行研究。
第六節 樣本選擇方式
在抽樣時,可以選擇重置或不重置選出的樣本。但大部分的調查抽樣都是採用不重置的方式。
重置抽樣
觀念:將選出物件重新放回原本的組織體當中,讓這個物件再被選中的機率維持不變的抽樣方式。
範例:從魚缸當中選取某些物件,每次選出後都會將該物件再放回去。
不重置抽樣
觀念:不將選出的物件放回原本的組織體當中的抽樣方式。使用這種方式時,每個物件僅會被選出一次。
範例:抽出樂透彩的號碼、在玩二十一點或其他撲克牌遊戲時從一副牌中抽出一張。
說明:使用不重置抽樣的方式時,每個物件僅會被選出一次。你應該選擇不重置抽樣的方式,而非重置抽樣的方式,因為大部分的統計學家皆認為前者較能抽出較具代表性的樣本。
主題書展
更多書展今日66折
您曾經瀏覽過的商品
購物須知
為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。
若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。