5分钟搞定Stata面板数据分析.docx
《5分钟搞定Stata面板数据分析.docx》由会员分享,可在线阅读,更多相关《5分钟搞定Stata面板数据分析.docx(13页珍藏版)》请在冰点文库上搜索。
5分钟搞定Stata面板数据分析
【原创】5分钟搞定Stata面板数据分析简易教程ver2.0作者:
张达
5分钟搞定Stata面板数据分析
简易教程
步骤一:
导入数据
原始表如下,
数据请以时间(1998,1999,2000,2001⋯⋯)为横轴,样本名(北京,天津,河北⋯⋯)为纵轴
将中文地名替换为数字。
注意:
表中不能有中文字符,否则会出现错误。
面板数据中不能有空值。
去除年份的一行,将其余部分复制到stata的dataeditor中,或保存为csv格式。
打开stata,调用数据。
方法一:
直接复制到dataeditor中。
方法二:
使用口令:
insheetusing 文件路径
调用例如:
insheetusing C:
\STUDY\paper\taxi.csv
其中csv格式可用excel的“另存为”导出
如图:
步骤二:
调整格式
首先请将代表样本的var1重命名
口令:
renamevar1 样本名
例如:
renamevar1province
也可直接在var1处双击,在弹出的窗口中修改:
接下来将数据转化为面板数据的格式
口令:
reshapelongvar,i(样本名)
例如:
reshapelongvar,i(province)
其中var代表的是所有的年份(var2,var3,var4⋯⋯)
转化后的格式如图:
转化成功后继续重命名,其中_j这里代表原始表中的年份,var代表该变量的名称
口令例如:
rename_jyear
renamevartaxi
也可直接在需要修改的名称处双击,在弹出的窗口中修改
如图:
步骤三:
排序
口令:
sort 变量名
例如:
sortprovinceyear
意思为将province按升序排列,然后再根据排好的province数列排year这一列
如图:
(虽然很多时候在执行sort前数据就已经符合要求了,但以防万一请务必执行此操作)
最后,保存。
至此,一个变量的前期数据处理就完成了,请如法炮制的处理所有的变量,也就是说每个变量都做一个dta文件。
在处理新变量前请使用
口令:
clear
将stata重置
这里为方便举例再处理一个名为so2的变量。
如图:
这样处理完全部变量:
步骤四:
合并数据
任意打开一个处理过的变量的dta文件作为基础表(推荐使用因变量的dta文件,这里使用so2作为因变量)
口令:
merge 样本名时间 using 文件路径
例如:
mergeprovinceyearusingC:
\STUDY\paper\taxi.dta
意思是将taxi的数据添加到so2的数据表中
如图:
然后使用
口令:
tab_merge
检验数据的差分,正常情况下_merge:
3一栏的percent应该为100%,如图
然后使用
口令:
drop_merge
将数据表中的_merge一列去掉,如图:
接着重新使用
口令:
sort 样本名时间
例如:
sortprovinceyear
为新生成的表排序。
如法炮制,将所有的变量都添加到基础表中,如图:
最终步骤:
回归
首先,使用
口令:
xtset 样本名时间
定义面板数据
例如:
xtsetprovinceyear
如图:
然后使用:
口令:
xtreg 因变量自变量
进行回归分析
例如:
xtregso2taxibusloaddriversroadlength
如图:
至此,使用stata进行面板数据回归分析完成。
以上是最基本的操作流程,恕鄙人才疏学浅。
如有问题欢迎交流和指正。