浙江大学教授陈强
A. 小白学统计|面板数据分析与Stata应用笔记(二)
面板数据分析与Stata应用笔记整理自慕课上浙江大学方红生教授的面板数据分析与Stata应用课程,笔记内容还参考了陈强教授的《高级计量经济学及Stata应用(第二版)》。以下是短面板数据分析的基本程序,以检验啤酒税降低交通死亡率的假说为例,数据来自陈强教授的《高级计量经济学及Stata应用(第二版)》中的“traffic.dta”数据集。下面分为四个步骤进行详细说明。
步骤一:模型设定与数据导入
构造一个双向固定效应模型,其中,被解释变量为交通死亡率,核心解释变量为啤酒税,另外三个可观测的控制变量包括酒精的消费量、税率和人均个人收入。模型包括不可观测的个体效应和时间效应。在Stata软件中,导入“traffic.dta”数据集,通过命令`use "data path raffic.dta"`进行数据导入。导入后,在Stata的“变量窗口”中查看数据集信息,确认数据集为48个州,1982-1988年的平衡面板数据集。
步骤二:描述性统计与作图
使用命令`sum`对关键变量进行描述性统计分析,通过`sum fatal beertax spircons unrate perinck`查看各变量的观测值、均值、标准差、最小值和最大值。绘制核心变量与被解释变量的散点图及回归直线,使用命令`twoway(scatter fatal beertax)(lfit fatal beertax)`进行散点图与回归直线绘制,以直观判断二者之间的关系。注意,此操作不是严格意义上的正确做法,应控制核心变量之外的其他影响因素,通过命令`reg`进行回归分析后,使用`avplot`命令得到核心变量与被解释变量的偏相关图,先通过`search avplot`安装avplot。
步骤三:模型选择
基于固定效应模型、随机效应模型和混合回归模型,选择最合适的模型进行分析。对于固定效应模型,首先生成年份虚拟变量,通过`tab year,gen(year)`命令,然后执行`xtreg fatal beertax spircons unrate perinck year2-year7 ,fe`进行双向固定效应模型估计。检验模型是否存在截面相关问题,使用`xtcsd`命令,先安装`ssc install xtcsd`,选择`xtcsd,fre`检验截面相关性。若存在截面相关,使用`xtscc`命令处理问题,然后再次检验州虚拟变量是否存在个体效应,通过`testparm _Istate*`命令进行F检验。
步骤四:报告计量结果
在经过以上步骤选择并估计模型后,报告模型结果。首先,处理模型中的截面相关、异方差和自相关问题,使用`xtscc`命令进行双向固定效应模型估计。通过`xtreg fatal beertax spircons unrate perinck year2-year7,fe cluster(state)`或`xtreg fatal beertax spircons unrate perinck year2-year7,fe robust`处理异方差和自相关问题,并比较不同标准误的估计结果。最后,通过`esttab`命令将所有存储结果放在一起比较,使用`estout`安装命令`ssc install estout`,使用`esttab`命令生成结果表,包括模型名称、标准误、显著性星号等信息。