5分钟搞定Stata面板数据分析.docx

资源描述

5分钟搞定Stata面板数据分析.docx

《5分钟搞定Stata面板数据分析.docx》由会员分享，可在线阅读，更多相关《5分钟搞定Stata面板数据分析.docx（13页珍藏版）》请在冰点文库上搜索。

5分钟搞定Stata面板数据分析.docx

5分钟搞定Stata面板数据分析

【原创】5分钟搞定Stata面板数据分析简易教程ver2.0作者：

张达

5分钟搞定Stata面板数据分析

简易教程

步骤一：

导入数据

原始表如下，

数据请以时间（1998，1999，2000，2001⋯⋯）为横轴，样本名（北京，天津，河北⋯⋯）为纵轴

将中文地名替换为数字。

注意：

表中不能有中文字符，否则会出现错误。

面板数据中不能有空值。

去除年份的一行，将其余部分复制到stata的dataeditor中，或保存为csv格式。

打开stata，调用数据。

方法一：

直接复制到dataeditor中。

方法二：

使用口令：

insheetusing 文件路径

调用例如：

insheetusing C:

\STUDY\paper\taxi.csv

其中csv格式可用excel的“另存为”导出

如图：

步骤二：

调整格式

首先请将代表样本的var1重命名

口令：

renamevar1 样本名

例如：

renamevar1province

也可直接在var1处双击，在弹出的窗口中修改:

接下来将数据转化为面板数据的格式

口令：

reshapelongvar,i（样本名）

例如：

reshapelongvar,i（province）

其中var代表的是所有的年份（var2,var3,var4⋯⋯）

转化后的格式如图：

转化成功后继续重命名，其中_j这里代表原始表中的年份，var代表该变量的名称

口令例如：

rename_jyear

renamevartaxi

也可直接在需要修改的名称处双击，在弹出的窗口中修改

如图：

步骤三：

排序

口令：

sort 变量名

例如：

sortprovinceyear

意思为将province按升序排列，然后再根据排好的province数列排year这一列

如图：

（虽然很多时候在执行sort前数据就已经符合要求了，但以防万一请务必执行此操作）

最后，保存。

至此，一个变量的前期数据处理就完成了，请如法炮制的处理所有的变量，也就是说每个变量都做一个dta文件。

在处理新变量前请使用

口令：

clear

将stata重置

这里为方便举例再处理一个名为so2的变量。

如图：

这样处理完全部变量：

步骤四：

合并数据

任意打开一个处理过的变量的dta文件作为基础表（推荐使用因变量的dta文件，这里使用so2作为因变量）

口令：

merge 样本名时间 using 文件路径

例如：

mergeprovinceyearusingC:

\STUDY\paper\taxi.dta

意思是将taxi的数据添加到so2的数据表中

如图：

然后使用

口令：

tab_merge

检验数据的差分，正常情况下_merge：

3一栏的percent应该为100%，如图

然后使用

口令：

drop_merge

将数据表中的_merge一列去掉，如图：

接着重新使用

口令：

sort 样本名时间

例如：

sortprovinceyear

为新生成的表排序。

如法炮制，将所有的变量都添加到基础表中，如图：

最终步骤：

回归

首先，使用

口令：

xtset 样本名时间

定义面板数据

例如：

xtsetprovinceyear

如图：

然后使用：

口令：

xtreg 因变量自变量

进行回归分析

例如：

xtregso2taxibusloaddriversroadlength

如图：

至此，使用stata进行面板数据回归分析完成。

以上是最基本的操作流程，恕鄙人才疏学浅。

如有问题欢迎交流和指正。

展开阅读全文