全球专业中文经管百科,由121,994位网友共同编写而成,共计436,017个条目

面板數據

用手机看条目

出自 MBA智库百科(https://wiki.mbalib.com/)

面板數據(Panel Data)

目錄

什麼是面板數據

  面板數據也叫“平行數據”,是指在時間序列上取多個截面,在這些截面上同時選取樣本觀測值所構成的樣本數據。

  其有時間序列和截面兩個維度,當這類數據按兩個維度排列時,是排在一個平面上,與只有一個維度的數據排在一條線上有著明顯的不同,整個表格像是一個面板,所以把panel data譯作“面板數據”。但是,如果從其內在含義上講,把panel data譯為“時間序列—截面數據”更能揭示這類數據的本質上的特點。也有譯作“平行數據”或“TS-CS數據(TimeS eries-Cross Section)”。

面板數據的分析方法

  步驟一:分析數據的平穩性(單位根檢驗

  按照正規程式,面板數據模型在回歸前需檢驗數據的平穩性。李子奈曾指出,一些非平穩的經濟時間序列往往表現出共同的變化趨勢,而這些序列間本身不一定有直接的關聯,此時,對這些數據進行回歸,儘管有較高的R平方,但其結果是沒有任何實際意義的。這種情況稱為稱為虛假回歸或偽回歸(spuriou sregression)。他認為平穩的真正含義是:一個時間序列剔除了不變的均值(可視為截距)和時間趨勢以後,剩餘的序列為零均值,同方差,即白雜訊。因此單位根檢驗時有三種檢驗模式:既有趨勢又有截距、只有截距、以上都無。

  因此為了避免偽回歸,確保估計結果的有效性,我們必須對各面板序列的平穩性進行檢驗。而檢驗數據平穩性最常用的辦法就是單位根檢驗。首先,我們可以先對面板序列繪製時序圖,以粗略觀測時序圖中由各個觀測值描出代表變數的折線是否含有趨勢項和(或)截距項,從而為進一步的單位根檢驗的檢驗模式做準備。

  單位根檢驗方法的文獻綜述:在非平穩的面板數據漸進過程中,Levin and Lin(1993)很早就發現這些估計量的極限分佈是高斯分佈,這些結果也被應用在有異方差的面板數據中,並建立了對面板單位根進行檢驗的早期版本。後來經過Levinetal.(2002)的改進,提出了檢驗面板單位根的LLC法。Levinetal.(2002)指出,該方法允許不同截距和時間趨勢,異方差和高階序列相關,適合於中等維度(時間序列介於25~250之間,截面數介於10~250之間)的面板單位根檢驗。Imetal.(1997)還提出了檢驗面板單位根的IPS法,但Breitung(2000)發現IPS法對限定性趨勢的設定極為敏感,並提出了面板單位根檢驗的Breitung法。Maddala and Wu(1999)又提出了ADF-Fisher和PP-Fisher面板單位根檢驗方法。

  由上述綜述可知,可以使用LLC、IPS、Breintung、ADF-Fisher和PP-Fisher5種方法進行面板單位根檢驗。

  其中LLC-T、BR-T、IPS-W、ADF-FCS、PP-FCS、H-Z分別指Levin,Lin&Chut*統計量、Breitungt統計量、lmPesaran & ShinW統計量、ADF-Fisher Chi-square統計量、PP-Fisher Chi-square統計量、HadriZ統計量,並且Levin,Lin&Chut*統計量、Breitungt統計量的原假設為存在普通的單位根過程,lm Pesaran & Shin W統計量、ADF-FisherChi-square統計量、PP-Fisher Chi-square統計量的原假設為存在有效的單位根過程,HadriZ統計量的檢驗原假設為不存在普通的單位根過程。

  有時,為了方便,只採用兩種面板數據單位根檢驗方法,即相同根單位根檢驗LLC(Levin-Lin-Chu)檢驗和不同根單位根檢驗Fisher-ADF檢驗(註:對普通序列(非面板序列)的單位根檢驗方法則常用ADF檢驗),如果在兩種檢驗中均拒絕存在單位根的原假設則我們說此序列是平穩的,反之則不平穩。

  如果我們以T(trend)代表序列含趨勢項,以I(intercept)代表序列含截距項,T&I代表兩項都含,N(none)代表兩項都不含,那麼我們可以基於前面時序圖得出的結論,在單位根檢驗中選擇相應檢驗模式。

  但基於時序圖得出的結論畢竟是粗略的,嚴格來說,那些檢驗結構均需一一檢驗。具體操作可以參照李子奈的說法:ADF檢驗是通過三個模型來完成,首先從含有截距和趨勢項的模型開始,再檢驗只含截距項的模型,最後檢驗二者都不含的模型。並且認為,只有三個模型的檢驗結果都不能拒絕原假設時,我們才認為時間序列是非平穩的,而只要其中有一個模型的檢驗結果拒絕了零假設,就可認為時間序列是平穩的。

  此外,單位根檢驗一般是先從水平(level)序列開始檢驗起,如果存在單位根,則對該序列進行一階差分後繼續檢驗,若仍存在單位根,則進行二階甚至高階差分後檢驗,直至序列平穩為止。我們記I(0)為零階單整,I(1)為一階單整,依次類推,I(N)為N階單整。

  步驟二:協整檢驗或模型修正

  情況一:如果基於單位根檢驗的結果發現變數之間是同階單整的,那麼我們可以進行協整檢驗。協整檢驗是考察變數間長期均衡關係的方法。所謂的協整是指若兩個或多個非平穩的變數序列,其某個線性組合後的序列呈平穩性。此時我們稱這些變數序列間有協整關係存在。因此協整的要求或前提是同階單整。

  但也有如下的寬限說法:如果變數個數多於兩個,即解釋變數個數多於一個,被解釋變數的單整階數不能高於任何一個解釋變數的單整階數。另當解釋變數的單整階數高於被解釋變數的單整階數時,則必須至少有兩個解釋變數的單整階數高於被解釋變數的單整階數。如果只含有兩個解釋變數,則兩個變數的單整階數應該相同。

  也就是說,單整階數不同的兩個或以上的非平穩序列如果一起進行協整檢驗,必然有某些低階單整的,即波動相對高階序列的波動甚微弱(有可能波動幅度也不同)的序列,對協整結果的影響不大,因此包不包含的重要性不大。而相對處於最高階序列,由於其波動較大,對回歸殘差的平穩性帶來極大的影響,所以如果協整是包含有某些高階單整序列的話(但如果所有變數都是階數相同的高階,此時也被稱作同階單整,這樣的話另當別論),一定不能將其納入協整檢驗

  協整檢驗方法的文獻綜述:(1)Kao(1999)、KaoandC hiang(2000)利用推廣的DF和ADF檢驗提出了檢驗面板協整的方法,這種方法零假設是沒有協整關係,並且利用靜態面板回歸的殘差來構建統計量。(2)Pedron(1999)在零假設是在動態多元面板回歸中沒有協整關係的條件下給出了七種基於殘差的面板協整檢驗方法。和Kao的方法不同的是,Pedroni的檢驗方法允許異質面板的存在。(3)Larssonetal(2001)發展了基於Johansen(1995)向量自回歸的似然檢驗的面板協整檢驗方法,這種檢驗的方法是檢驗變數存在共同的協整的秩。

  主要採用的是Pedroni、Kao、Johansen的方法。

  通過了協整檢驗,說明變數之間存在著長期穩定的均衡關係,其方程回歸殘差是平穩的。因此可以在此基礎上直接對原方程進行回歸,此時的回歸結果是較精確的。

  這時,我們或許還想進一步對面板數據做格蘭傑因果檢驗(因果檢驗的前提是變數協整)。但如果變數之間不是協整(即非同階單整)的話,是不能進行格蘭傑因果檢驗的,不過此時可以先對數據進行處理。引用張曉峒的原話,“如果y和x不同階,不能做格蘭傑因果檢驗,但可通過差分序列或其他處理得到同階單整序列,並且要看它們此時有無經濟意義。”

  下麵簡要介紹一下因果檢驗的含義:這裡的因果關係是從統計角度而言的,即是通過概率或者分佈函數的角度體現出來的:在所有其它事件的發生情況固定不變的條件下,如果一個事件X的發生與不發生對於另一個事件Y的發生的概率(如果通過事件定義了隨機變數那麼也可以說分佈函數)有影響,並且這兩個事件在時間上又有先後順序(A前B後),那麼我們便可以說X是Y的原因。考慮最簡單的形式,Granger檢驗是運用F-統計量來檢驗X的滯後值是否顯著影響Y(在統計的意義下,且已經綜合考慮了Y的滯後值;如果影響不顯著,那麼稱X不是Y的“Granger原因”(Granger cause);如果影響顯著,那麼稱X是Y的“Granger原因”。同樣,這也可以用於檢驗Y是X的“原因”,檢驗Y的滯後值是否影響X(已經考慮了X的滯後對X自身的影響)。

  Eviews好像沒有在POOL視窗中提供Granger causality test,而只有unit root test和cointegration test。說明Eviews是無法對面板數據序列做格蘭傑檢驗的,格蘭傑檢驗只能針對序列組做。也就是說格蘭傑因果檢驗在Eviews中是針對普通的序列對(pairwise)而言的。你如果想對面板數據中的某些合成序列做因果檢驗的話,不妨先導出相關序列到一個組中(POOL視窗中的Proc/Make Group),再來試試。

  情況二:如果如果基於單位根檢驗的結果發現變數之間是非同階單整的,即面板數據中有些序列平穩而有些序列不平穩,此時不能進行協整檢驗與直接對原序列進行回歸。但此時也不要著急,我們可以在保持變數經濟意義的前提下,對我們前面提出的模型進行修正,以消除數據不平穩對回歸造成的不利影響。如差分某些序列,將基於時間頻度的絕對數據變成時間頻度下的變動數據或增長率數據。此時的研究轉向新的模型,但要保證模型具有經濟意義。因此一般不要對原序列進行二階差分,因為對變動數據或增長率數據再進行差分,我們不好對其冠以經濟解釋。難道你稱其為變動率的變動率?

  步驟三:面板模型的選擇與回歸

  面板數據模型的選擇通常有三種形式:

  1.混合估計模型(Pooled Regression Model)。如果從時間上看,不同個體之間不存在顯著性差異;從截面上看,不同截面之間也不存在顯著性差異,那麼就可以直接把面板數據混合在一起用普通最小二乘法(OLS)估計參數。

  2.固定效應模型(Fixed Effects Regression Model)。如果對於不同的截面或不同的時間序列,模型的截距不同,則可以採用在模型中添加虛擬變數的方法估計回歸參數。

  3.隨機效應模型(Random Effects Regression Model)。如果固定效應模型中的截距項包括了截面隨機誤差項和時間隨機誤差項的平均效應,並且這兩個隨機誤差項都服從正態分佈,則固定效應模型就變成了隨機效應模型。

  在面板數據模型形式的選擇方法上,我們經常採用F檢驗決定選用混合模型還是固定效應模型,然後用Hausman檢驗確定應該建立隨機效應模型還是固定效應模型。

本條目對我有幫助109
MBA智库APP

扫一扫,下载MBA智库APP

分享到:
  如果您認為本條目還有待完善,需要補充新內容或修改錯誤內容,請編輯條目投訴舉報

本条目由以下用户参与贡献

Lin.

評論(共3條)

提示:評論內容為網友針對條目"面板數據"展開的討論,與本站觀點立場無關。
161.23.23.* 在 2017年6月26日 21:40 發表

真正明白的人看了以後覺得講的都沒用,不明白的人看了還是不明白

回複評論
Mis铭 (討論 | 貢獻) 在 2017年6月27日 09:28 發表

161.23.23.* 在 2017年6月26日 21:40 發表

真正明白的人看了以後覺得講的都沒用,不明白的人看了還是不明白

MBA智庫百科是可以自由參與的百科,如有發現錯誤和不足,您也可以參與修改編輯!

回複評論
220.163.40.* 在 2020年1月21日 09:50 發表

至少能知道用這個東西該怎麼做。

回複評論

發表評論請文明上網,理性發言並遵守有關規定。

打开APP

以上内容根据网友推荐自动排序生成

下载APP

闽公网安备 35020302032707号