ImageVerifierCode 换一换
格式:DOCX , 页数:10 ,大小:20.96KB ,
资源ID:7600005      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bingdoc.com/d-7600005.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(Stata上机实验笔记Word格式.docx)为本站会员(b****3)主动上传,冰点文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰点文库(发送邮件至service@bingdoc.com或直接QQ联系客服),我们立即给予删除!

Stata上机实验笔记Word格式.docx

1、文件名.do 命令文件 3。文件名.ado 程序文件 如果不加改变,安装时Stata会将系统程序安装到: C:Program filestata10 中。 将所用系统自带的一些系统数据、应用程序、帮助文件安装到 C:Program filestata10adobase 中 将所有升级程序安装到:Program filestata10ado%update 中所有的系统自带数据可以利用sysuse命令打开。Use命令只能打开 C:data 或者 D:data 中的数据。如果需要打开其他文件夹的数据,必须改变目录(例如,将自己的数据放入D:abc) cd ” 或者直接 file-open 特别注意:

2、1。Stata的命令区分大小写。大部分命令可以缩写。 use 打开数据文件,一般加clear选型清空内存中现有数据。 sysuse 打开系统数据文件。 describe 描述数据 edit 利用数据编辑器进行数据编辑 list 类似于edit,但只能显示不能修改数据。 display 显示计算结果。经常写为: di summarize 求某个变量的观察值个数、平均值、标准差、最小值和最大值。sum scatter 生成两个变量的散点图。 set obs 定义样本个数(使用前一定要用drop或者clear命令清空) generate 建立新变量并赋值。经常写为gen 举例:画出Y=X2的曲线图

3、drop _all (drop data from memory) set obs 100 (make 100 observations) gen x = _n (x = 1, 2, 3, ., 100) gen y = x2 (y = 2, 4, 9, ., *) scatter y x (make a graph) stata命令格式 by varlist: command varlist =exp if exp in range weight , optionsCommand 命令动词,经常用缩写。varlist 表示一个变量或者多个变量,多个变量之间用空格隔开。如 sum price

4、weight by varlist 分类信息 按照某一变量的不同特性分类 4。 =exp 赋值及运算 5。 if exp 挑选满足条件的数据 6。 in range 对数据进行范围筛选 7。 Weight 给数据赋一个权重 8。 , options 命令增加一些可选信息 Stata数据处理Stata的数据格式为 文件名.dta对于系统自带数据文件,任何情况下可以用 sysuse 命令打开。对于C:data(或者D:data)下的文件,可以使用use命令打开。 4。 放在其他目录的文件可以利用设置目录或者“打开” 菜单打开。 Stata数据类型 数值型:用0、1、29 及+、C(正负号)与小数点

5、和( )来表示。 字符型:字符串变量由字母数字或一些特殊的符号组成(如地名、住址,职 业等等)。 注意:数字不表示大小信息,如电话、身份证号等。 字符型数据必须要加 “”。 日期型:在Stata中,1960 年1 月1 日被认为是第0 天,因此1959 年12 月31 日为第-1天,表示形式为:jan/10/2001或者10jan2001。 数据导入直接录入。 利用data editor在Excel或者记事本文件编辑好后导入。 直接粘贴Import导入 除了csv格式,还可以导入txt格式和raw格式。 添加标签为整个数据添加标签:例如,将数据命名为“工资表”。 菜单:Data-Labels-

6、Label dataset 命令:label data “工资表“为变量增加标签,例如,给变量wage增加标签“年工资总额” 菜单:Data-Labels-Label variables 命令 label variable wage “年工资总额3.为变量值增加标签 例如:为变量marrid添加数值标签marry:1=married; 0=Unmarried 菜单:Data-Labels-Label values-Define or modify label values Data-Labels-Label values-Assign label values to variable 命令:

7、. label define marry 1 “married” 0 “unmarried. label values married marry Stata作图 STATA 提供各种曲线类型,包括点(scatter)、线(line)、面(area),直方图(histogram)、 条形图(bar)、饼图(pie)、函数曲线(function)以及矩阵图(matrix)等。 同时,对时间序列数据有以ts 开头的一系列特殊命令,如tsline。还有一类是对双变量的回归拟合图(lfit、qfit 、lowess)等。 小样本OLS 小样本OLS假设条件较为严格 假设1: 二者之间存在线性关系 y

8、= a0 + a1*x1 + a2*x2 + . + ak*xk + y = Xb + 假设2: X 是满秩的,i.e. rank(X) = k 假设3: 干扰项的条件期望为零(严格外生性) * E| X = 0 通过上课的学习我们得到: ?(XX)?1Xy 习惯上我们用 y_hat = X*b /* 被解释变量的拟合值*/ e = y - y_hat = y - Xb /* 残差 */ 建立回归方程 打开系统文件auto,建立如下方程: sysuse auto,clear regress price mpg weight foreign Regress命令详解: regress depvar

9、 indepvars if in weight , options要求方程省略常数项(自己设置常数项) reg price mpg weight foreign, nocons(hascons) 2。稳健性估计(一般用于大样本OLS) reg price mpg weight foreign, vce(robust) 或者:reg price mpg weight foreign, r 3。设置置信区间(默认95%) reg price mpg weight foreign, level(99) 4。标准化系数 reg price mpg weight foreign, beta 5。部分数据

10、回归 reg price mpg weight length foreign in 1/30 (为什么foreign被drop掉?) reg price mpg weight length if foreign=0 回归结果解读 系数/标准误差= t值 P值 系数=0的概率为 p值 在5%的水准上显著不为0 否则和0的差异不显著 95%下限=估计值-t值*标准误差 95%下限=估计值+t值*标准误差 置信区间: 系数在95%的概率下会落在-之间 跨越0,则与0不显著 模型常用的其他形式: 对数 平方项 n次方 指数 交乘项 虽然对函数形式的选择有检验方法,但最好还是从“经济意义”角度确定。 回

11、归后预测值的获得 Predict拟合值的获得: predict yhat, xb 或者 predict yhat 2。残差的获得 predict e , residuals 或者 predict e, res 回归的假设检验 Test命令 例一 sysuse auto, clear reg price mpg weight length 1。检验参数的联合显著性 2。分别检验各参数的显著性三个参数对被解释变量的影响相同 例二: use wage2, clear reg lnwage educ tenure exper expersq教育(educ)和工作时间(tenure)对工资的影响相同。

12、test educ=tenure工龄(exper)对工资没有影响 test exper 或者 test exper =0 3。检验 educ和 tenure的联合显著性 test educ tenure 或者 test (educ=0) (tenure=0) 例三:生产函数production use production,clear reg lny lnl lnk test lnl lnk test (lnl=0.8) (lnk=0.2) test lnk+lnl=1 非线性检验:testnl 例一 . sysuse auto gen weight2 = weight2 reg price

13、mpg trunk length weight weight2 foreign testnl _bmpg = 1/_bweight testnl (_bmpg = 1/_bweight) (_btrunk = 1/_blength)打开production reg lny lnl lnk testnl _blnl * _blnk = 0.25 testnl _blnl * _blnk = 0.5 大样本OLS 大样本OLS经常采用稳健标准差估计(robust) 稳健标准差是指其标准差对于模型中可能存在的异方差或自相关问题不敏感,基于稳健标准差计算的稳健t统计量仍然渐进分布t分布。因此,在Sta

14、ta中利用robust选项可以得到异方差稳健估计量。 约束回归 定义约束条件 constraint define n 条件 约束回归语句 Cnsreg 被解释变量 解释变量, constraints(条件编号) 例一:打开production cons def 1 lnl+lnk = 1 cnsreg lny lnl lnk, c (1)sysuse auto,clear cons def 1 price = weight cons def 2 displacement = weight cons def 3 gear_ratio = -foreign cnsreg mpg price wei

15、ght displacement gear_ratio foreign length, c(1-3) (本题没有什么经济意义,只是让大家熟悉这种方法) 矩阵运算手动建立矩阵命令:matrix Matrix input 矩阵变量名=(矩阵) 同一行元素用,分隔 不同行元素用分割 建立矩阵 : 3 6 8 5 11 7 2 18 16 显示矩阵变量 mat dir显示矩阵内容 Mat list 矩阵变量 常用矩阵运算: C=A+B A-B A*B Kronecker乘积 :C=A#B 常用矩阵函数: trace(m1) m1的迹 Diag(v1) 向量的对角矩阵 inv(m1) m1的逆矩阵还可以

16、将变量转换为矩阵 mkmat 变量名表,mat(矩阵名) 练习:sysuse auto reg price mpg weight foreign 要求:利用矩阵运算手动计算出参数 gen cons = 1 mkmat price, mat(y) mkmat mpg weight foreign cons, mat(X) mat b = inv(X*X)*X*y mat list b mat list y mat list X 我们可以利用矩阵运算的方法将回归结果展现的所有统计量都手动计算出来。 逐步回归法 逐步回归法分为逐步剔除和逐步加入。 逐步剔除又分为逐步剔除(Backward selec

17、tion)和逐步分层剔除(Backward hierarchical selection) 1。逐步剔除 stepwise, pr(显著性水平): 回归方程 例如:对auto数据 Stepwise,pr(0.05):reg price mpg rep78 headroom trunk weight length turn displacement gear_ratio foreign逐个分层剔除 Stepwise,pr(0.05) hier:reg price mpg rep78 headroom trunk weight length turn displacement gear_ratio

18、 foreign 去掉foreign 重新做一遍 逐步加入又分为逐步加入(Forward selection)和逐步分层加入(Forward hierarchical selection) 1。逐步加入 stepwise, pe(显著性水平): Stepwise,pe(0.05):逐个分层加入 Stepwise,pe(0.05) hier:reg price mpg rep78 headroom trunk weight length turn displacement gear_ratio foreign 残差点的图形表示 rvfplot:残差拟合值图 可以加参数yline(0) 将e 与?

19、y 画在一起 rvpplot x1:残差预测值图 将e 与x1 画在一起 avplot avplots lvr2plot 离群样本点与杠杆样本点 离群样本点:残差值较大的样本点 杠杆样本点:与样本整体(XX)很不相同的少数样本点 离群样本点: reg price mpg weight foreign predict e,res List make price e reg price mpg weight foreign predict lev, leverage lvr2plot lvr2plot, mlabel(make) 作业1 考察工资方程(数据文件:cps78-85.dta) Log(

20、wage) = Xb+u X中包括educ=教育、exper=工龄、exper2=工龄平方、tenure=现有岗位的任期、female=性别(女=1)、y85=85年、y85educ=交叉积、y85fem=交叉积。建立回归模型给出各参数的99%置信区间检验H1:educ、tenure对工资影响相同、H2:教育对收入没有影响4。预测拟合值和残差观测离群值和杠杆值 1. 建议回归模型: 设 Log(wage)=x1educ+x2exper+x3exper2+x4tenure+x5female+x6y85+x7y85educ+x8y85fem 2.给出各参数的99%的置信区间 Reg Log edu

21、c exper exper2 tenure female y85 y85educ y85fem,level(99) 3.检验H1:educ,tenure对工资影响相同 Test educ=tenure 检验H2:test educ 4.预测模拟值:predict yhat 预测残差值:predict e,res 5.观测离群值: 极大似然估计 优点: 1.在所有一致的,渐进正太的估计量中,MLE是渐进最优的。 2.大样本数据,特别是非线性回归的估计具有优势。 缺点: 1.需要假设特定的概率密度形式 2.小样本性质一般。 MLE的基本步骤 1.推导最大似然函数 2.编写似然函数的stata程序(可选:似然函数的一阶和二阶导数d1,d2) 3.设定解释变量和被解释变量:ml model命令 4.估计最大似然函数:ml maximize命令 举一个最简单的多元线性回归的例子: 假设

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2