商品簡介
● 本書內容結合「理論、方法、統計」,幫助您正確、精準處理Panel-data迴歸模型。
● 完整剖析各項統計分析技巧,模型建立好簡單,迅速提升研究力!
● 圖解操作流程,跟著老師的指示,無痛學習STATA指令功能。
● 本書範例結合光碟檔案學習,帶領讀者熟悉軟體及統計觀念,一步一步深入分析。
要真正了解現代經濟生活的數量關係,「統計學」、「經濟理論」與「數學」皆是不可或缺。「計量經濟學」便是整合了這三者,藉由統計工具將經濟理論付諸實際的實用學科。
其中,panal-data迴歸模型包含樣本單位在某一時點上的多項特性,以及在一段時間內的連續觀察。這種結合橫斷面與時間數列的資料型態,不僅可應用於個體、總體經濟領域,更能延伸至社會科學、醫學及金融領域。
本書利用STATA統計軟體,幫助研究者正確、精準地使用panel-data迴歸模型。STATA功能龐大,眾多內建(外掛)指令,幾乎囊括SPSS、SAS、LISREL/HLM、jMulti、Gretl、AMOS、LIMDEP及Eviews的處理能力。在此則專注在STATA處理panel-data迴歸模型的各項統計概念及分析技巧。
本書各章皆有實際案例分析,配合光碟附檔與書中圖文指示練習,可讓學習者及研究者快速熟悉STATA統計軟體的操作、強化統計分析的基本功。
作者簡介
張紹勳
學歷:國立政治大學資訊管理博士
現任:國立彰化師大專任教授
經歷:致理技術專任副教授
●研究助理
張任坊
國立海洋大學商船系
張博一
國立台北大學通訊工程學系
目次
Chapter 01 追蹤資料/縱橫資料(Panel-Data)
1-1 前言
1-1-1 研究設計的類型
1-1-2 各大學興起建立Panel 資料庫
1-2 迴歸模型之重點整理
1-2-1 簡單OLS 迴歸模型之重點整理
1-2-2 線性:Panel 迴歸模型之重點整理
1-3 追蹤資料(panel-data) 簡介
1-3-1 橫斷面研究之侷限性
1-3-2 縱貫面研究的種類
1-3-3 縱貫面應用在社科研究之策略
1-3-4 Panel 迴歸模型的優缺點
1-3-5 追蹤資料的研究議題
1-4 追蹤資料(panel-data) 分析之Stata 相關指令
1-5 追蹤資料(panel-data) 之基本模型
1-5-1 Panel 資料型態及其模型分類
1-5-2 追蹤資料(panel-data) 模型:線性vs. 非線性模型
1-5-3a 追蹤資料(panel-data) 模型認定(identify) 與假設
1-5-3b FE、BE、RE 三種追蹤資料(panel-data) 分析原理之實例解說
1-5-4 橫斷面:最小平方虛擬變數(LSDV) 迴歸模型之實作
1-5-5 追蹤資料(panel-data) 模型認定( 固定vs. 隨機效果)的進階
1-6 線性Panel 模型
1-6-1 xtreg 指令之報表解說
1-6-2 線性Panel 模型:xtreg 指令之五種效果型態
1-6-2a 範例:xtreg 指令之五種追蹤資料(panel-data)效果型態
1-6-2b 你該選Fixed Effects 或Random Effects 呢?用Hausman (1978) 檢定來判定
1-6-3 Two-Way 效果模型( 固定效果reg、隨機/混合效果icc 指令)
1-7 追蹤資料模型的效果選擇(pooled OLS、固定效果、隨機效果?)
1-7-1 F 檢定( 該選pooled OLS vs. 固定效果?):「xtreg?, fe」指令
1-7-2 Lagrange 乘數檢定(pooled OLS vs. 隨機效果?):隨機效果的事後指令xttest0
1-7-3 F 檢定、Lagrange 乘數(multiplier) 檢定、Hausman 檢定之流程
1-7-4 該選固定效果或隨機效果呢:Hausman 檢定(hausman 指令)
Chapter 02 簡易Panel-Data 法( 混合資料OLS 法,reg 指令)
2-1 最小平方法(OLS) 迴歸之假定(assumption)
2-2 不同年代婦女生育能力有變化嗎?
2-3 垃圾焚燒爐的位置對房價影響
2-4 歷年犯罪率(Crime Rates in North Carolina)
Chapter 03 時間序列之序列相關:線性動態模型
3-1 認識自我相關(AR)、序列相關(SC)
3-1-1 進行OLS 統計時應注意之事項
3-1-2 Longitudinal data 之序列相關
3-1-3 干擾項(Disturbances) 帶有AR(p) 結構(autoregressive of order p)
3-1-4 偵測序列相關(SC) 之方法:線性動態模型
3-1-4a Durbin-Watson 檢定法:限AR(1) 之偵測法
3-1-4b 更高階之殘差AR(p) 的檢定法有三:線性動態模型
3-2 Longitudinal data 序列相關( 先bgodfrey 偵測,再newey/prais指令解決)
3-2-1 序列相關AR(3)( 先reg、bgodfrey 偵測,再newey 指令解決)
3-2-2 序列相關AR(4)( 先dwatson、bgodfrey再newey/prais)
3-3 更多時間序列範例:誤差項具有AR ?
3-3-1 時間序列之誤差項有AR(1)( 先reg 再newey 指令修正AR1)
3-3-2 偵測時間序列中誤差項AR(3)( 先reg, bgodfrey 再newey 指令)
3-3-3 時間序列中誤差項帶有AR ( 先reg 再prais 指令)
3-4 Panel-data 序列相關:Wooldridge 檢定(xtserial 指令)
3-5 Panel-data 迴歸中誤差項有AR(1)
3-5-1a 自我相關檢定方法一:誤差帶AR(1) 的xtregar 指令
3-5-1b 自我相關檢定方法二:xtserial 指令
3-5-1c 自我相關檢定方法三:先reg、ivreg2 再abar;直接xtabond2
3-6 Panel 殘差之自我相關及殘差異質性之實作步驟
3-6-1a 混合資料(pooled) 效果模型vs. 樣本平均(PA)模型誰優?
3-6-1b 單因子個體效果vs. 單因子時間效果
3-6-1c 判定固定效果或隨機效果呢? (hausman 指令)
3-6-1d 誤差帶AR(1) 之Panel 模型? (xtregar 指令)
3-6-1e 偵測Panel 誤差異質性(xttest3)、自我相關(xttest2 指令)
3-6-1f 一併處理Panel 誤差異質性、自我相關(xtgls 指令)
Chapter 04 誤差變異之異質性(xtgls 指令為主流)
4-1 殘差之變異數
4-1-1 誤差變異σ2εit 的觀念
4-1-2 誤差變異σ2εit 的偵測法
4-2 偵測誤差之異質性(Heteroskedasticity)
4-2-1 橫斷面OLS 迴歸:殘差異質性診斷(hettest 指令)
4-2-2 殘差異質的改善:OLS 改成Robust 迴歸
4-2-3 橫斷面之誤差異質性:需ln() 變數變換( 先reg 再whitetst 指令)
4-2-4 縱貫面之誤差異質性( 先reg 再bpagan 指令)
4-2-5 縱貫面(Longitudinal-data) 誤差ARCH(先reg 再bpagan 指令)
4-3 Panel-data 誤差變異σ2εit 的相依性及異質性
4-3-1 Panel-data 相依性/同時期相關檢定(先xtgls 再xttest2 指令)
4-3-2a 偵測Panel-data 之σ2εit 異質性(方法一:先xtgls 再lrtest 指令)
4-3-2b 異質性Panel-data 二種誤差相關性(xtgls?, panels(hetero)corr(ar1) 等選項)
4-3-2c 偵測Panel-data 之σ2εit 異質性(方法二:直接用lmhlrxt 指令)
4-3-3 FGLS 實作Panel-data 之誤差自我相關及誤差異質變異(xtgls 指令)
4-4 Panel-data 有誤差自我相關且異質的誤差變異(xtpcse 指令)
Chapter 05 追蹤資料(Panel-Data) 迴歸之進階
5-1 追蹤資料/縱橫資料(panel-data)
5-1-1 追蹤資料之迴歸模型(panel-data Regression Model)
5-1-2 Stata 在追蹤資料(panel-data) 的應用
5-2 Panel「wide form」轉成「long form」: wages 範例
5-3 長型(Long) panels
5-3-1 長型(Long) panels 特性
5-3-2 長型(Long) panels 的指令
5-4 線性panel 之六種估計法
5-4-1 混合資料OLS 法(reg 指令)
5-4-2 混合資料OLS 法(reg, vce(cluster i) 指令)
5-4-3 混合資料OLS 法(「xtgee, corr(ar 2) vce(robust)」指令)
5-4-4 組間之廣義最小平方(Between GLS) 估計(xtreg, be 指令)
5-4-5 固定效果(or within) 之估計(xtreg, fe 指令)
5-4-6 隨機效果之估計(xtreg, re 指令)
5-4-7 帶有單根,一階差分估計 (reg, vce(cluster i) 指令)
5-4-8 線性panel 各估計法之se 比較
5-5 固定效果vs. 隨機效果之選擇
5-6 Panel IV( 工具變數):xtivreg 指令之一階差分
5-7 隨機係數(Random coefficients) 模型(xtrc 指令)
Chapter 06 聯立方程式( 內生的共變):工具變數及兩階段最小平方法(2SLS)
6-1 工具變數及兩階段最小平方法(2SLS)
6-1-1 進行OLS 統計分析時應注意之事項
6-1-2 工具變數(IV) 之重點整理
6-1-3 隨機解釋變數X(random regressor) 與工具變數Z(instrumental variable)
6-1-4a 單一工具變數及單一內生變數:內生性檢定
6-1-4b 兩階段最小平方法迴歸:Wu-Hausman 內生性檢定(「estat endogenous」指令)
6-1-5 為何需要多個工具變數?
6-1-6 工具變數(instrumental variables) 在教育的應用
6-1-7 兩階段迴歸vs. 最小平方法迴歸之範例
6-2 橫斷面/ panel:如何偵測需要工具變數呢?
6-2-1 為何「教育水準」需要多個工具變數Z 呢?
6-2-2 橫斷面Hausman 檢定:OLS vs. 2SLS 誰優?(hausman 指令)
6-2-3 Panel-data Hausman-Taylor 法:需工具變數嗎?(xthtaylor)
6-2-4 橫斷面:雙工具變數之兩階段迴歸(ivregress 2sls 指令)
6-2-5 橫斷面:單一工具變數之二階probit 迴歸(ivprobit?, twostep 指令)
6-3 Panel-data:工具變數及兩階段最小平方法(xtivreg 指令)
6-3-1 線性panel 資料進階問題的處理:內生性/多層次
6-3-2 偵測panel 資料之內生性(xtivreg 指令)
6-3-2a Panel 固定效果:無工具變數xtreg vs. 有工具變數xtivreg 指令誰優?
6-3-2b Panel 隨機效果有IV「G2SLS、EC2SLS 法」會比無IV 優嗎(xtivreg 指令)
6-3-2c Panel-data 一階差分之估計:兩階段迴歸合(xtivreg?, fd 指令)
Chapter 07 Panel-data 單根檢定及共整合
7-1 時間序列:單根檢定(unit root test)
7-1-1 時間序列:單根檢定法之解說
7-1-2 單根檢定之流程
7-1-3 認識常用的單根檢定法
7-1-4 時間序列:ADF 單根檢定
7-1-5 Augmented Dickey-Fuller(ADF) 單根檢定法
7-2 常見panel-data 單根檢定法
7-2-1 Panel-data: Levin and Lin Test (xtunitroot llc 指令)
7-2-2 Panel-data: IPS 檢定(xtunitroot ips 指令)
7-2-3 Panel-data: Fisher Test 檢定(xtunitroot fisher 指令)
7-3 Panel-data 單根檢定之實例
7-4 時間序列之共整合分析
7-4-1 cointegration 分析步驟
7-4-2 Stata 實例:時間序列之共整合分析
7-5 Panel 共整合之解說
7-6 以誤差修正為基礎之panel-data 共整合檢定
7-6-1 以誤差修正為基礎之共整合檢定公式
7-6-2a 共整合檢定方法一:group-mean 檢定法
7-6-2b 共整合檢定方法二:panel 檢定法
7-6-2c 漸進檢定分配(asymptotic test distribution)
7-6-2d 橫斷面之相依性(cross-sectional dependence)
7-7 誤差修正為基礎之panel-data 共整合的實證研究
7-7-1 xtwest 指令語法
7-7-2 Error-correction-based 之panel 共整合分析(xtwest 指令)
Chapter 08 非線性:計數型panel 模型
8-1 非線性panel models 之應用領域
8-1-1 非線性:Panel 迴歸模型之分類
8-1-2 計數型(Count) 模型:Zero-inflated Poisson 迴歸之解說
8-1-3 非線性:Panel 迴歸模型之重點整理
8-1-4 非線性panel models 的指令
8-2 非線性Panel 四種估計法
8-2-1 非線性Panel:Pooled 法或Population-averaged 估計法
8-2-2 非線性Panel:隨機效果估計
8-2-3 非線性Panel:隨機斜率估計
8-2-4 非線性Panel:固定效果(FE) 估計
8-3 非線性Panel:計數型(count data) 迴歸之範例
8-3-1 Nonlinear panel:計數型(count) 迴歸之各指令
8-3-2 Count data 過度分散(over dispersed) 範例(xtsum 指令)
8-4 概似為基礎(Likelihood-based) 之Count 模型各種指令的解說
8-4-1 Panel Poisson 方法一:pooled Poisson 迴歸(poisson 指令)
8-4-2 Panel Poisson 方法二:樣本平均(PA)Poisson 迴歸(xtgee 指令)
8-4-3a Panel Poisson 方法三:隨機效果(RE) 之gamma 隨機效果(xtpoisson, re 指令)
8-4-3b Panel Poisson 方法四:隨機效果(RE) 之normal 隨機效果(xtpoisson, re 指令)
8-4-4 Panel Poisson 方法五:固定效果(「xtpoisson, fe」、「xtpqml,fe」指令)
8-4-5 上述五種「帶cluster-robust 標準誤之Poisson 估計」的比較
8-4-6 動差為基礎,固定效果計數型panel (FE count panel)
8-4-7 Panel Poisson 方法六:廣義動差法(GMM)
8-4-7a 橫斷面、線性:廣義動差法(GMM) 估計
8-4-7b 線性兩階段最小平方(ivregress 2sls):廣義動差法(GMM) 估計
8-4-7c 帶Lag 項CAPM 模型:廣義動差法(GMM) 的估計
8-4-7d 帶Endogenous regressor 之Poisson 模型:廣義動差法(GMM)
8-4-7e Logit Panel 模型:使用xtgee、xtlogit 指令
8-5 多層次混合(Multilevel mixed) 模型
8-5-1a 分層隨機抽樣
8-5-1b 偵測兩個敵對模型,誰比較適配你的樣本?
8-5-2a 線性、橫斷面:多層次混合迴歸(xtmixed 指
8-5-2b 線性、縱貫面:Mixed 或multilevel 或hierarchical model(xtmixed 指令)
8-5-2c 線性、縱貫面:多層成長模型(xtmixed 指令)
8-5-2d 追蹤(panel) 資料:多層隨機截距/隨機斜率模型(xtmixed 指令)
8-5-2e 追蹤(panel) 資料:三層之隨機截距/隨機斜率模型(xtmixed 指令)
8-5-3 線性:廣義估計方程式(GEE) 分析Panel-data(xtgee 指令)
8-5-4a 非線性:雙層次混合Logistic 迴歸(xtmelogit 指令)
8-5-4b 非線性:三層次Logistic 迴歸(xtmelogit 指令)
8-5-5 非線性計數型迴歸:三層次Poisson 迴歸(xtmepoisson 指令)
8-5-6 異質性誤差之隨機截距或混合效果模型(xtmixed 指令)
8-5-7 潛在成長曲線(xtmixed+ nlcom 指令)
8-6 群聚的資料(clustered data)
8-6-1 群聚資料之panel 模型( 指令「xtreg?, vce (cluster)」)
8-6-2 群聚資料(clustered data) 之Stata 估計
8-6-3 群聚資料(clustered data) 實作( 各種迴歸模型)
Chapter 09 線性:動態Panel-Data 模型
9-1 經濟數學模型
9-2 線性:動態(dynamic) panel 模型
9-2-1 線性動態panel 模型:廣義動差法(xtabond、xtdpd 指令)
9-2-2a GMM 應用於動態Panel Data 模型
9-2-2b 線性動態panel 模型:廣義動差法(xtdpdsys、gmm 指令)
9-2-3 Arellano-Bond 線性動態panel-data 估計(xtabond 指令)
9-2-3a Arellano-Bond 一階差分動態模型(xtabond 指令)
9-2-3b 比較Arellano-Bond 一階差分動態四種模型(xtabond 指令)
9-2-4 Arellano-Bond 線性動態panel-data 估計(xtdpd 指令)
參考文獻
書摘/試閱
Chapter 01 追蹤資料/ 縱橫資料(Panel-Data)
當你要使用本書CD 所附資料檔,你可以先將資料copy 到硬碟之任一資料夾中。在Stata 畫面再設定工作目錄,為剛才複製的資料夾路徑,即「File >Chang working directory」。例如,作者自定「D:\04_ 廣義時間序列:追蹤資料(panel-data) 分析」為工作目錄。接著再選「File > Open」,開啟任一「*.dta」資料檔,即可進行資料分析。
1-1 前言
一、希臘字母大小寫之意義
在傳統之統計學裡,習慣上,大小寫a, b, c 代表常數(constant) 或係數(coefficient);f, g, h 代表函數;i, j, k 代表整數;小寫x, y, z 代表變數;大寫X, Y, Z 代表矩陣。樣本的參數( 平均數M、標準差S⋯⋯) 慣用大寫英文字母;母群體樣本的參數( 平均數μ、標準差σ⋯⋯) 慣用小寫希臘字母。倘若這些英文字母「符號」仍不夠用,統計學家會納入希臘字母。
在多變量統計、計量經濟之時間序列裡,由於它包含多個迴歸式,這多個迴歸「恆等式」同時求解,就叫聯立方程式,又稱向量迴歸。人們為了簡化這種波動性「向量迴歸」的預測或共整合關係式,就改用「矩陣形式」恆等式來求該係數矩陣的特徵值(Eigen value)、特徵向量(Eigen vector),進而求出「聯立迴歸式」的解。為了統合這些代表矩陣的符號,於是,數學家就以「小寫英文字」代表變數( 序列)。「大寫希臘字」代表係數向量/係數矩陣(coefficientmatrix),它是(m×n) 矩陣。「小寫希臘字」代表單一係數(coefficient)。
二、何謂Panel 迴歸?
迴歸分析與相關分析著重在兩個或是多個變數之間的線性關係。一般來說在此兩種分析模型當中,我們通常會利用自變數x 來預測依變數y,而在時間序列分析當中,通常會把時間當作是自變數來分析依變數,亦即探討依變數y 在不同時間點的變化,並且利用過去依照時間排列的數據來預測未來的資訊。此類數據即為一時間序列,時間序列的分析則著重於研究數據序列的相互依賴關係。時間序列的資料在經過分析之後,藉由瞭解其相互關係來發展出適合的預測模型。
追蹤資料(panel-data)( 廣義longitudinal data),中文譯為縱橫資料、面板資料、追蹤資料或時空資料,是一種結合橫斷面與時間序列的資料型態。Panel 分析又分靜態vs. 動態兩種,其中,動態研究又分變遷研究及發展研究兩種。有鑑於近十年來,追蹤資料(panel-data) 在理論性和應用性的研究已經成為計量經濟的熱門主題,致使其他學域亦相繼地改以追蹤資料(panel-data) 作為樣本設計。
三、計量經濟的興起
純粹概念性的理論顯然在實際問題的解釋與應用上是有限的;而缺乏理論基礎的統計分析則無法提供一個「因果關係」的說明,同樣,其說服力也是有限的,或甚至可能是錯誤的。因而興起計量經濟學(Econometrics),它是經濟學門的一個分支。計量經濟學字面上的意義是指「經濟的衡量(economicmeasurement)」,較精確的說法,計量經濟學是探討「實證研究方法」的研究學門,將概念性的經濟理論藉由實際的資料予以數量化的研究學門。
弗里希在《計量經濟學》的創刊詞中說到:「用數學方法探討經濟學可以從好幾個方面著手,但任何一方面都不能與計量經濟學混為一談。」經驗表明,統計學、經濟理論和數學這三者對於真正瞭解現代經濟生活中的數量關係來說,都是必要的,但各自並非是充分條件。而三者結合起來,便構成了計量經濟學。
與一般的數學方法相比,計量經濟學方法有十分重要的特點和意義:
1. 研究對象發生變化:即從研究確定性問題轉向非確定性問題,其對象的性質和意義將發生巨大的變化。因此,在方法的思路上、方法的性質上和方法的結果上,都將出現全新的變化。
2. 研究方法發生變化:計量經濟學方法的基礎是概率論和數理統計,是一種新的數學形式。學習中要十分注意其基本概念和方法思路的理解和把握,要充分認識其方法與其他數學方法的根本不同之處。
3. 研究結果發生變化:我們應該知道,計量經濟學模型的結論是概率意義上的,也可以說是不太確定的。但真正要理解其不確定性的涵義,並非那麼簡單,學習中需要始終關注這一點。
總而言之,「計量經濟學」係藉由統計工具將概念性的經濟理論付諸實際的一項學科。而Stata 提供的longitudinal data 及panel-data 迴歸更是坊間最佳的統計工具,有關longitudinal data 各種迴歸方法,在作者《Stata 在總體經濟及財務金融的應用》一書中有詳細介紹,panel-data 迴歸則在本書來介紹。
四、財務與經濟計量方法
財務與經濟計量主要是運用統計學的方法來探討財務或經濟變數的關係,通常是藉助「迴歸模型(regression model)」的架構,來探討某一個變數的變動對另一個變數的影響關係,在分析的過程中對於模型的估計(estimate)、檢定(test)與預測(forecast) 均是方法論上的研讀重點。
追蹤資料(panel-data)( 縱橫資料) 是一個同時包含橫斷面(cross-section) 與時間序列(time series) 資料的資料組合方法,處理追蹤資料(panel-data) 時,需將每個橫斷面單位(unit) 依時間序列資料方式排列後,再堆積(stack) 每個橫斷面樣本,由於有些經濟效果同時混和時間序列與橫斷面而無法單獨分離測試,此時若單獨使用橫斷面或時間序列計量方法來估計經濟效果,必無法正確估計其影響,而追蹤資料(panel-data) 可使研究者對同時摻雜橫斷面與時間序列的經濟現象做一有效的估計。
亦即追蹤資料是針對相同個體( 如個人、家戶、部門、廠商、產業或國家),連續調查多年所收集的資料。資料收集的頻率多為一年一次,少數情形有季或月等較高頻率。也就是說,其能同時包括橫斷面和時間序列兩種特性,每一年度中,可觀察到許多橫斷面個人、家戶、部門、廠商、產業或國家,或是同一對象連續觀察多年,意味著其蘊含著訊息較單純的橫斷面和時間序列資料更加豐富,不但能保有時間序列之動態性質,又能兼顧橫斷面資料之個體差異的特性。
五、調查法的特性
常見調查設計之適用性如下:
(表格)
各種調查設計資料品質之潛在效果:
(表格)
1-1-1 研究設計的類型
研究(research) 是一套完整的科學性歷程。它是有系統地為社會現象、自然現象及其關係提供解釋的一連串活動歷程。它也是研究者從研究問題的提出到問題解答,產生的連貫性和邏輯性的知識建構發展過程。
何謂研究設計呢?研究設計的內容至少包括:
1. 研究的類型。
2. 研究對象的規劃( 母體、樣本)、( 實驗組vs. 對照組)。
3. 抽樣的方式、樣本的安排、研究概念的操作與測量。
4. 研究工具的設計。
5. 研究資料的收集方式。
6. 研究資料的處理、分析與研究目的的連結。
常見的研究設計,有下列三類:
1. 橫斷面調查(cross section survey):係指資料收集的時間僅侷限在單一的時間點,對研究變數依據收集所得的資料進行描述性分析和討論。橫斷面調查係目前政府機關辦理調查之大宗,無論就調查規劃分析及決策應用而言,皆已臻成熟之境。例如,定期提供勞動統計資料之「人力資源調查」、家戶經濟資料之「家庭收支調查」、受雇員工福利、工時相關資料之「受雇員工薪資調查」及社會各面向議題及其變遷情形之「社會發展趨勢調查」等。詳細應用方法,請見作者《Stata 高等統計分析》一書。橫斷面研究實用性強,且被廣泛採用,但一旦遇到要分析變化的時候,橫斷面研究就不能勝任了。
2. 縱貫面調查(longitudinal survey):係針對研究變數進行一種跨越長時間觀察的資料收集( 至少於二次以上的時間點收集資料)。縱貫面調查即以同一問項,定期或不定期辦理多次。其優點為能夠觀察研究因時間而產生變化的因子,有利於探討因果關係。通過這種方法,在研究變化這個問題上,縱貫面研究比橫斷面研究更勝一籌。
縱貫面研究設計,包括以下幾個選項:固定樣本小組(panel) 設計、重複橫斷面設計( 又叫趨勢分析),以及事件史分析。
(1) 固定樣本panel 設計「fixed-sample panel design,又叫做追蹤研究(panel study)」是「最純粹」的縱貫面設計。「固定樣本」,顧名思義就是在多個時間點對同一樣本進行調查。由於追蹤研究對同一批人進行跟蹤調查,所以這種研究設計最適合研究特定個體的變化過程。追蹤研究分析,研究設計「操弄」起來較十分困難。
(2) 重複橫斷面設計,顧名思義,為了達到分析變化的目的,這種設計把橫斷面研究「重複」兩次或更多次。更具體地說,趨勢設計分兩次或更多次收集資料,但要求母群體不變,只是每次調查的是不同的樣本。樣本的選擇是趨勢設計和追蹤設計的關鍵區別。追蹤設計每輪次研究都必須訪問相同的對象,而趨勢設計每輪次則是從同一個母群體中抽取不同的樣本進行資料收集工作。這一特點使得趨勢設計,可以克服追蹤設計的主要缺陷。
(3) 事件史分析:實徵動態社會分析大抵可歸為兩類,即事件史分析(event history analysis) 與追蹤資料分析。社會學的事件史分析與生物統計不同之處,在於前者關心動態的時程,而後者往往只需組間平均差異,因此社會學家常發現,所謂的「Cox 模型」不估計行為對時間的相依性,會限制其對分析現象之理解,而應該考慮採用有母數之模型來描述此相依性。另外,早期社會學的追蹤資料分析多仰賴結構方程模型,但晚近的追蹤資料分析則重視以動態的研究設計,來控制「未觀察到的異質性」所導致的偏誤,而更有利於因果推論的建立。
縱貫面設計應用分析,請見作者《Stata 在總體經濟及財務金融的應用》一書。
3. Panel( 追蹤/縱橫) 分析:在一段時間內研究某一群特定樣本與趨勢研究相比,固定樣本多次收集資料研究可以顯示出研究依變數(dependent variable)在研究期間不同時間之改變。
由於對於個體逐時變化之原因與其解讀,因為逐次隨機抽取樣本之故,無法形成因果機制,故最佳解決方式莫過於鎖定同一組樣本進行縱貫之Panel 觀測,此亦為歐美先進國家積極實施之觀測方式,不僅行之有年,其資料亦廣獲政府及各界採用,並已擷取極多深具貢獻之決策資源。
易言之,panel study 是最近很流行的研究設計方式,主要是指針對相同的一群人(a panel),重複收集多個時間點的資料,再加以分析比較,因此panel study是一種廣義時間序列(genalized longitudinal) 的研究型態。Panel study 經常與計量經濟學或迴歸分析結合,運用於計量經濟、社會科學或健康相關的研究。
從研究設計的角度來看,panel study 最主要的特色與優點是可以控制( 排除)許多與研究對象有關、不隨時間改變的因素之影響,例如性別、基因、智力、種族等「非時變」因素,因此可以讓研究人員探討主要的自變數與依變數之間的關係。
1-1-2 各大學興起建立Panel 資料庫
追蹤資料(panel-data) 亦可譯成「面板資料」、「縱橫資料」,是用來描述一個總體中某一群指定樣本在一段時間的情況,並對樣本中每一個樣本單位都進行多重觀察。這種多重觀察既包括對樣本單位在某一時期( 時點) 上多個特性進行觀察,也包括對該樣本單位的這些特性在一段時間的連續觀察,連續觀察將得到資料集稱為panel 資料。最早是Mundlak(1961), Balestra 和Nerlove(1966)把追蹤資料(panel-data) 引入到計量經濟中。從此以後,大量關於追蹤資料(panel-data) 的分析方法、研究文章如雨後春筍般出現。
伴隨著經濟理論,包括總體經濟理論和個體經濟理論、電腦技術和統計方法的發展,追蹤資料在經濟學領域的應用逐漸被計量經濟學家推廣。在總體經濟領域,它被廣泛應用於經濟增長、技術創新、金融、稅收政策等領域;在個體經濟領域,它被大量應用於就業、家庭消費、入學、市場行銷等領域。
目前,世界上已經成立了專門研究追蹤資料(panel-data) 的協會,每兩年舉辦一次全球性的追蹤資料學術交流大會。入會者均是從事追蹤資料研究的經濟學家、計量經濟學家、統計學家和社會學家。迄今,追蹤資料(panel-data) 分析的新方法和新的應用領域,已延伸至社會科學、醫學和金融學等領域。
美國最著名的兩個追蹤資料資料庫,一個是俄亥俄(Ohio) 大學的NLS 資料庫(the National Longitudinal Surveys of Labor Market Experience); 另一個則是密西根大學的PSID 資料集(University of Michigan’s Panel Study of Income Dynamics)。NLS 資料集包括五個獨立的與勞動力有關的panel 資料集,這五個panel 資料集的主體,包括1966 年45 歲到59 歲的成年男子、1966 年14 歲到24 歲的青年男子、1967 年30 歲到44 歲的成年女子、1968 年14 歲到24 歲的青年女子、1979 年14 歲到21 歲的男女青年。調查的變數有上千個,主要側重瞭解勞動力市場上供給方的情況。
1. 俄亥俄(Ohio) 大學的人力資源之panel 資料庫
2. 密西根(Michigan) 大學的PSID 資料集
PSID 資料集(University of Michigan’s Panel Study of Income Dynamics) 由從1968 年起直到現在所收集的6,000 個家庭和15,000 個人的5,000 多個變數的資料構成,這5,000 多個變數涉及就業狀態、收入、家庭資產、住房、上班交通工具、汽車擁有等方面。收集這些追蹤資料資料庫主要是為了研究美國貧窮人口狀況及其貧窮原因。除此之外,這些資料庫還被用來監測和解釋經濟狀態變化以及經濟和社會狀況對人們生活的影響。
3. 康乃爾(Connell) 大學之panel 資料庫
4. 普林斯頓(Princeton) 大學之panel 資料統計
5. 美國犯罪資料庫
6. 香港科技大學(http://caser.ust.hk/?act=project_hkpssd) 亦著手建立panel 資料庫,如下圖。
主題書展
更多書展今日66折
您曾經瀏覽過的商品
購物須知
為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。
若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。