R软件-分位数回归案例.ppt

上传人:wj 文档编号:16289638 上传时间:2023-07-12 格式:PPT 页数:31 大小:2.72MB
下载 相关 举报
R软件-分位数回归案例.ppt_第1页
第1页 / 共31页
R软件-分位数回归案例.ppt_第2页
第2页 / 共31页
R软件-分位数回归案例.ppt_第3页
第3页 / 共31页
R软件-分位数回归案例.ppt_第4页
第4页 / 共31页
R软件-分位数回归案例.ppt_第5页
第5页 / 共31页
R软件-分位数回归案例.ppt_第6页
第6页 / 共31页
R软件-分位数回归案例.ppt_第7页
第7页 / 共31页
R软件-分位数回归案例.ppt_第8页
第8页 / 共31页
R软件-分位数回归案例.ppt_第9页
第9页 / 共31页
R软件-分位数回归案例.ppt_第10页
第10页 / 共31页
R软件-分位数回归案例.ppt_第11页
第11页 / 共31页
R软件-分位数回归案例.ppt_第12页
第12页 / 共31页
R软件-分位数回归案例.ppt_第13页
第13页 / 共31页
R软件-分位数回归案例.ppt_第14页
第14页 / 共31页
R软件-分位数回归案例.ppt_第15页
第15页 / 共31页
R软件-分位数回归案例.ppt_第16页
第16页 / 共31页
R软件-分位数回归案例.ppt_第17页
第17页 / 共31页
R软件-分位数回归案例.ppt_第18页
第18页 / 共31页
R软件-分位数回归案例.ppt_第19页
第19页 / 共31页
R软件-分位数回归案例.ppt_第20页
第20页 / 共31页
亲,该文档总共31页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

R软件-分位数回归案例.ppt

《R软件-分位数回归案例.ppt》由会员分享,可在线阅读,更多相关《R软件-分位数回归案例.ppt(31页珍藏版)》请在冰点文库上搜索。

R软件-分位数回归案例.ppt

分位数回归模型在R环境下的实现,中国人民大学统计学院左辰潘岚锋,大纲,引言分位回归模型的基本结构回归系数的渐进分布参数估计残差形态的检验一个实例,一、引言,传统回归模型的缺陷:

1只反映均值变化2Gauss-Markov假设条件太强分位回归模型1拟合在不同分位数水平下的估计值,可以反映更多的信息2对残差分布放松假设Rpackage:

quantregbyRogerKoenker,二、模型的构造,其中:

因变量相互独立自变量残差项回归系数表示分位数水平的回归系数,rq(yx,tau=,method=br),以quantreg包中的engel为例:

自变量:

income-年收入因变量:

foodexp-食品消费额fit1=rq(foodexpincome,data=engel)#tau值缺省为0.5,表示中位数回归fit2=rq(foodexpincome,data=engel,tau=c(0.1,0.25,0.75,0.9)#对0.1,0.25,0.75,0.9四个分位数水平进行回归,中位数回归和均值回归的差异,均值回归受到离群点影响,稳健性的试验,目的:

比较均值回归、中位数回归系数的稳定性方法:

1计算原模型的预测值、残差2从残差中抽样加入到预测值中,重新作均值回归和中位数回归3统计两种回归系数的分布,结果,三、回归系数的渐进分布,考虑独立同分布的场合模型:

残差分布:

双尾指数(Laplace)随机生成1000次,统计在0.1,0.2,0.9水平上的分位回归系数:

rq(yx,tau=seq(0.1,0.9,length=9),此外,可以观察回归系数的误差在不同分位数水平上的变化,四、参数估计,给出一个分位回归模型fit=rq(yx)后,命令summary(fit,se=)可以查看参数估计的结果se选项用于选择参数估计的不同方法,主要有1se=ker:

核函数估计法2se=boot:

Bootstrap方法3se=rank:

秩检验,1核函数估计法,因为残差分布未知,无法直接求出Powell给出如下估计方法:

2秩检验,秩检验是R中进行参数估计的默认方法。

该方法绕开了对未知变量的非参数估计,Jurekova,Guttenbrunner(1992)通过对偶规划问题的解,构造出一组秩统计量,渐进服从T分布summary(fit,se=nid)结果:

Call:

rq(formula=foodexpincome)tau:

10.5Coefficients:

ValueStd.ErrortvaluePr(|t|)(Intercept)81.4822519.250664.232700.00003income0.560180.0282819.810320.00000,秩检验(续),Koenker,Machado(1994)推广了秩检验的思路,构造出非渐进分布意义下的参数估计方法summary(fit)结果:

Call:

rq(formula=foodexpincome)tau:

10.5Coefficients:

coefficientslowerbdupperbd(Intercept)81.4822553.25915114.01156income0.560180.487020.6019注意:

置信区间不是关于估计值对称的,3Bootstrap,通过放回抽样的Monte-Carlo试验,得到回归系数的均值和标准差运用T统计量的方法,构造置信区间summary(fit,se=boot,bsmethod=xy)结果:

Call:

rq(formula=foodexpincome)tau:

10.5Coefficients:

ValueStd.ErrortvaluePr(|t|)(Intercept)81.4822526.624213.060460.00247income0.560180.0339916.482630.00000,五、残差形态的检验,分位数回归模型的一个重要应用就是对两种残差分布的如下两种形态作检验:

1位置漂移模型(locationshiftmodel)2位置-尺度漂移模型(location-scaleshiftmodel),检验的思路:

观察随的变化情况,位置漂移模型:

除常数项分量之外,与分位数水平无关反映在图上,不同分位数水平上的回归直线相互平行,对分位数回归过程(regressionquantileprocess)作图,分位数回归过程:

对一簇分位数水平作回归得到的一组模型例子rqpr=rq(yx,tau=1:

99/100)plot(summary(rqpr),位置-尺度漂移模型,由表达式可以看出,向量的各分量随变化的规律是一致的模拟实例:

x1-seq(1,10,length=1000)x2=rnorm(1000,mean=0,sd=10)x3=rexp(1000,rate=0.1)u=runif(1000,min=-2,max=2)y=x1+2*x2-x3+u*(-2*x1+x2-x3)rqpr=rq(yx1+x2+x3,tau=10:

90/100)plot(summary(rqpr),回归系数的变化情况基本一致,是位置-尺度漂移模型的典型特征,检验方法,Khmaladze检验Koenker&肖志杰(2002)引入Khmaladze鞅变换技术,计算统计量R:

KhmaladzeTest(yx1+x2+x3,nullH=location/location-scale)#nullH:

零假设(nullhypothesis),默认为location,表示位置漂移模型,六、一个例子:

barro,该数据记录了世界各国GDP的增长率和相关因子,共有161个观测;其中前71个观测在1965年1975年取得;后90个观测是19851987年间取得。

因子包括:

:

GDP年增长率lgdp2:

人均GDPmse2:

男性高中教育情况fse2:

女性高中教育情况fhe2:

女性高等教育情况mhe2:

男性高等教育情况lexp2:

人均期望寿命lintr2:

人均资本占有gedy2:

教育投入占GDP的比重Iy2:

投资占GDP的比例gcony2:

公共设施建设占GDP的比例lblakp2:

黑市借贷佣金率pol2:

政治稳定性指数ttrad2贸易增长率。

1、中位数回归,library(quantreg)data(barro)attach(barro62:

161,)rqm=rq(lgdp2+mse2+fse2+fhe2+mhe2+lexp2+lintr2+gedy2+Iy2+gcony2+lblakp2+pol2+ttrad2)summary(rqm,se=nid),2分位数回归过程,rqa=rq(lgdp2+mse2+fse2+fhe2+mhe2+lexp2+lintr2+gedy2+Iy2+gcony2+lblakp2+pol2+ttrad2,tau=10:

90/100)rqas=summary(rqa)plot(rqas),红色区域:

最小二乘回归的参数图中看出各参数显著性,3剔除自变量的影响,rrs.test(lgdp2+lexp2+lblakp2+mse2+fse2,pol2+fhe2+mhe2+lintr2+gedy2+Iy2+gcony2+ttrad2,)结果:

$sn,11,4.66242$ranks10.3355367390.3265540080.2952627520.3038393480.398400879待检验的自变量个数为8个查表知,可见剔除这些自变量对模型无显著影响,对剩余自变量作分位数回归过程,rqa=rq(lgdp2+lexp2+lblakp2+mse2+fse2,tau=10:

90/100)rqas=summary(rqa)plot(rqas),4残差分布形态的检验,位置漂移模型:

KhmaladzeTest(lgdp2+lexp2+lblakp2+mse2+fse2),位置-尺度漂移模型:

KhmaladzeTest(lgdp2+lexp2+lblakp2+mse2+fse2,nullH=location-scale),查表可知,在0.1的显著性水平下,两种模型都不能被拒绝但从统计量数值看,位置尺度漂移模型相对更合理,八、总结,线性分位数回归模型中的应用,quantreg中的基本函数和分析流程分位数模型与传统回归模型相比,回归参数更加稳健,同时可以反映更多的信息通过不同分位数水平的残差分布,可以对位置-漂移模型和位置-尺度漂移模型做出检验quantreg包中还包括非参数统计的分位数估计,此外,分位数回归在时间序列方面也逐渐有更多的应用,谢谢!

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 解决方案 > 营销活动策划

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2