浙江大學教授陳強
A. 小白學統計|面板數據分析與Stata應用筆記(二)
面板數據分析與Stata應用筆記整理自慕課上浙江大學方紅生教授的面板數據分析與Stata應用課程,筆記內容還參考了陳強教授的《高級計量經濟學及Stata應用(第二版)》。以下是短面板數據分析的基本程序,以檢驗啤酒稅降低交通死亡率的假說為例,數據來自陳強教授的《高級計量經濟學及Stata應用(第二版)》中的「traffic.dta」數據集。下面分為四個步驟進行詳細說明。
步驟一:模型設定與數據導入
構造一個雙向固定效應模型,其中,被解釋變數為交通死亡率,核心解釋變數為啤酒稅,另外三個可觀測的控制變數包括酒精的消費量、稅率和人均個人收入。模型包括不可觀測的個體效應和時間效應。在Stata軟體中,導入「traffic.dta」數據集,通過命令`use "data path raffic.dta"`進行數據導入。導入後,在Stata的「變數窗口」中查看數據集信息,確認數據集為48個州,1982-1988年的平衡面板數據集。
步驟二:描述性統計與作圖
使用命令`sum`對關鍵變數進行描述性統計分析,通過`sum fatal beertax spircons unrate perinck`查看各變數的觀測值、均值、標准差、最小值和最大值。繪制核心變數與被解釋變數的散點圖及回歸直線,使用命令`twoway(scatter fatal beertax)(lfit fatal beertax)`進行散點圖與回歸直線繪制,以直觀判斷二者之間的關系。注意,此操作不是嚴格意義上的正確做法,應控制核心變數之外的其他影響因素,通過命令`reg`進行回歸分析後,使用`avplot`命令得到核心變數與被解釋變數的偏相關圖,先通過`search avplot`安裝avplot。
步驟三:模型選擇
基於固定效應模型、隨機效應模型和混合回歸模型,選擇最合適的模型進行分析。對於固定效應模型,首先生成年份虛擬變數,通過`tab year,gen(year)`命令,然後執行`xtreg fatal beertax spircons unrate perinck year2-year7 ,fe`進行雙向固定效應模型估計。檢驗模型是否存在截面相關問題,使用`xtcsd`命令,先安裝`ssc install xtcsd`,選擇`xtcsd,fre`檢驗截面相關性。若存在截面相關,使用`xtscc`命令處理問題,然後再次檢驗州虛擬變數是否存在個體效應,通過`testparm _Istate*`命令進行F檢驗。
步驟四:報告計量結果
在經過以上步驟選擇並估計模型後,報告模型結果。首先,處理模型中的截面相關、異方差和自相關問題,使用`xtscc`命令進行雙向固定效應模型估計。通過`xtreg fatal beertax spircons unrate perinck year2-year7,fe cluster(state)`或`xtreg fatal beertax spircons unrate perinck year2-year7,fe robust`處理異方差和自相關問題,並比較不同標准誤的估計結果。最後,通過`esttab`命令將所有存儲結果放在一起比較,使用`estout`安裝命令`ssc install estout`,使用`esttab`命令生成結果表,包括模型名稱、標准誤、顯著性星號等信息。