崔业庆 0944004 对研究生招生人数的多元线性回归分析.docx
《崔业庆 0944004 对研究生招生人数的多元线性回归分析.docx》由会员分享,可在线阅读,更多相关《崔业庆 0944004 对研究生招生人数的多元线性回归分析.docx(13页珍藏版)》请在冰点文库上搜索。
![崔业庆 0944004 对研究生招生人数的多元线性回归分析.docx](https://file1.bingdoc.com/fileroot1/2023-5/21/5b51c625-b2cc-4161-bb8d-ce7a28a9afc7/5b51c625-b2cc-4161-bb8d-ce7a28a9afc71.gif)
崔业庆0944004对研究生招生人数的多元线性回归分析
对研究生招生人数的多元线性回归分析
崔业庆
(0944004经济学一班)
摘要:
本文通过1985至2009年研究生招生人数的数据,引入了高校毕业生数量、国内生产总值、国家财政教育支出、城乡家庭平均收入、高校数量和高校教师数量等多个解释变量进行多元回归。
同时进行了多重共线性的检验,留下了高校教师数量、国家财政教育支出、国内生产总值三个解释变量,得到模型二回归方程Y=-1.050828+0.875629㏑X7+1.419787㏑X3-0.916242㏑X2,模型三进行了一阶差分,结果为YC=1135.321-0.047503X1C+8.575512X3C+0.580951X7C,并通过了平稳性、相关性、异方差的检验。
最终结果显示,教师数量和国家对教育的财政投入最重要,是影响研究生招生人数的关键,并得出了教育对财政支出没有跟上GDP的发展速度,国家要加大多教育的投入。
关键词:
研究生招生人数多元线性回归时间序列
一、引言
随着社会的竞争越发的激烈,对求职者要求更加的严格,高校毕业生人数不断地增加,报考研究生的人数正在逐年增加中。
尤其是在2008年经济危机以后,报考研究生似乎是一个不错的选择,包括自己在内,周围很多人都有读研的倾向。
在“十五”期间,我国研究生的招生人数、在校人数和毕业人数平均增长率都保持在23%以上,说明我国“已从研究生教育的小国逐步跨人世界研究生教育大国的行列”。
按照每个数据平均数和平均增长率推算,“十一五”期间研究生总人数和平均人数都将超过“十五”的1倍左右。
到2010年,在学的全日制和非全日制研究生规模达到硕士研究生120万,博士研究生15万。
尽管我国研究生教育的规模发展迅速,可是“在高等教育扩招的背景下,在校研究生规模占
全国各类高等教育在校生的比例依然很低,仅从1999年的2.3%增长到2004年的4.6%。
”有学者认为,我国高等学历教育规模增长的速度明显快于我国经济发展,且已开始超过经济发展的承受能力,呈现出扩招起步快、增长不平稳、大起大落的态势,毕业研究生总量供大于求。
但毕业研究生“十五”期间平均就业率仍然保持在92.78%,说明国家经济社会的发展还是很需要高层次人才的。
由此可以看出,报考研究生是应对激烈竞争社会,顺利求职的一个不错的选择,所以分析研究生招生人数是势在必行,很有价值和参考意义。
研究生教育是我国高等教育的重点,研究生招生、毕业人数的发展趋势研究历来是该领域的研究热点。
以往的研究大多是对现状的统计及分析,且以文字描述为主,较少采用数学和计量统计的方式对发展趋势进行拟合与推测。
本研究以计量的方式,对研究生招生人数从1985-2009年的统计数据进行多元回归分析,引入多个解释变量,进行拟合估计,得出对研究生招生人数影响的因素,对报考研究生提供一个参考估计价值。
二、文献综述
自1977年恢复高考以来,已有35个年头,所以采取的样本多是改革开放以后,有以时间序列为数据的,也有以横截面数据,针对不同省份报名人数的分析,模型也是多种多样。
武警警种指挥学院的丁凡与曲爽在《我国毕业研究生增长趋势模型构建与拟合推测》中参考众多趋势分析模型基础上,综合考虑长期趋势与短期趋势对数据的影响,构建模型,从毕业研究生人数增长趋势的角度,以数学建模的方法,拟合与推测毕业研究生人数增长趋势。
采用经典的拟合效果评估指标对拟合误差进行评估,评估指标有:
误差平方和、误差标准差、平均绝对误差、平均相对误差。
拟合结果提示目前毕业研究生人数增长过快,未来五年(2009-2013)年我国研究生毕业人数可能呈现平稳增长态势。
丁凡,黄晓明,李秀梅,王莉对国内研究生招生、毕业人数横向及纵向发展趋势进行拟合与推测,收集1998至2008年国内研究生招生、毕业人数数据。
以计算相关系数及曲线拟合的方式描述研究生招生及毕业人数之间的横向关系;构建数学模型分别对国内研究生招生、毕业人数纵向发展趋势进行拟合与推测。
结果显示1998至2008年国内研究生招生、毕业人数均呈不断增长趋势。
相关系数计算结果显示两者之间呈高度正相关,两者横向关系可用曲线拟合描述。
以上都采用了时间序列模型,而西南财经大学统计学院的汪扬采用了不同省、市、自治区报名人数的截面数据进行分析。
在针对不同省份报名人数的分析中,引入了人均国内生产总值、高等院校毕业生人数、城镇登记失业率作为解释变量,从模型中可以发现应届大学毕业生的增加是研究生报考人数增加的主要因素,人均GDP在相对水平上的增加也会使研究生报考人数增加,但是失业率对研究生报考的影响不大。
本文在前人的基础上,采用1985至2009年的时间数据,引入多个解释变量,包括高校毕业生数量、国内生产总值、国家财政教育支出、城镇居民家庭人均可支配收入、农村居民家庭人均纯收入、普通高等学校数、普通高等学校教师数,对研究生招生人数进行多元线性回归,旨在更全面的得出影响研究生招生人数的因素,以及所采取的对策,通过多个模型,对数模型和一阶差分,对研究生招生人数进行全面的分析,并通过了平稳性、相关性、异方差的检验。
三、模型变量的分析
影响研究生招生人数的因素是非常多的,许多因素之间是存在着相关性的,有些因素起着决定性的作用,有些因素则不那么重要。
由于影响因素较多,如果都加以考虑,会带给分析带来了难度。
惟有理出若干个对招生规模有重大影响的因素,在此基础之上,研究它们与招生人数的内在关系。
所谓主要影响因素,它们必须具备这样的条件:
其它的因素对招生的影响弱于这些因素;其它因素对招生的影响力可以通过选定的因素得到直接或间接的反映;选定的因素彼此之间对招生规模的影响是独立的。
根据以上背景介绍和理论分析,我们选取了以下数据作为我们分析的解释变量:
3.1高校毕业生数量
由前人的研究可知,高校毕业生数量是研究生招生数量至关重要的一个因素,是对研究生招生人数的总供给,直接决定了其规模大小,是必需考虑的一个重要解释变量。
3.2国内生产总值
“十五”期间,我国政府公共教育经费占GDP的比例总是徘徊在2%左右,长期低于发展中国家上世纪80年代的平均水平(4%),如果按人均教育经费算,中国更是远少于其他国家。
高等教育财政性经费在国家总教育经费不足和高等教育财政经费占总教育经费比例不高的双重作用下,中国高等教育财政性经费就更显得捉襟见肘了,形成了严重的教育缺欠。
这样它对于我们研究高校研究生招生人数具有重要意义。
3.3国家财政教育支出
国家财政内教育经费包括财政对教育的拨款、城乡教育费附加、企业办中小学支出、校办产业减免税等,反映了国家对教育的投入情况,与招生人数有着密切的关系。
3.4城乡家庭平均收入
随着教育产业化的推进,大量的教育投入由受教育者自身承担,中国社科院2005年《教育蓝皮书》显示,子女教育费用在中国居民总消费中排在第一位。
大学学费在近20年的时间里上涨了约25倍,10倍于居民收入的增长。
教育费用的迅速上涨让城乡居民颇感压力,更让低收入人群不堪负重。
家庭平均收入成为是否能够承担子女接受高等教育的决定因素。
3.5高校数量和高校教师数量
他们是衡量一个国家教育实力和教育综合资源的量化指标之一,于研究高等教育区域均衡与不均衡发展的关系也有重要影响。
综上所述,设如下变量
Y为研究生招生人数(人),X1为高校毕业生数量(人),X2为国内生产总值(亿元),X3为国家财政教育支出(亿元),X4为城镇居民家庭人均可支配收入(
X5为农村居民家庭人均纯收入(元),X6为普通高等学校数(所),X7为普通高等学校教师数(人)
如下图3-1所示,作出被解释变量Y(研究生招生人数)的趋势图。
被解释变量Y(研究生招生人数)柱状图3-1
我们可以看出,每年被解释变量Y(研究生招生人数)随着时间在不断增加中,特别是进入二十一世纪后,这种趋势就显得更见明显了。
可见二十一世纪最缺少的是人才这种说法是有根据的,国家也在不断重视高端人才的培养。
四、模型的建立
为了更好的设计模型,避免模型发生偏误,必须进行散点图的分析,作出各个自变量与应变量的趋势图。
下图是Y为研究生招生人数(人)对X1为高校毕业生数量(人),X2为国内生产总值(亿元),X3为国家财政教育支出(亿元),X4为城镇居民家庭人均可支配收入(元),X5为农村居民家庭人均纯收入(元),X6为普通高等学校数(所),X7为普通高等学校教师数(人)的散点图,并画出回归线:
图4-1
图4-1为X1对Y的散点图,画出其余解释变量对Y的散点图,根据图形,设定模型一。
从散点图可以看出,x1对Y明显的弯曲,所以为了使模型个准确,采用对数形式。
原始模型设定为,模型一
㏑Y=β0+β1㏑X1+β2㏑X2+β3㏑X3+β4㏑X4+β5㏑X5+β6㏑X6+β7㏑X7+µ
其中β0,β1,β2,β3,β4,β5,β6,β7分别为未知参数,µ为残差,与七个自变量无关。
服从N(0,σ2)分布。
用eviews6.0进行多元线性回归,得回归方程(括号内为标准差):
㏑Y=-21.23347+-1.844398㏑X1+-0.673402X2+0.642821X3+-0.152363
(0.472863)(1.300384)(0.309326)
㏑X4+1.245395㏑X5+-0.969596㏑X6+4.533662㏑X7+µ
(1.337489)(0.639436)(0.989779)(1.272557)
画出回归结果图形4-2:
多元回归结果图4-1
解释变量可能存在多从共线关系,见表4-1
表4-1
R-squared
0.986583
AdjustedR-squared
0.981058
T统计量的检验表4-2
表4-2
解释变量
T值
显著程度
X1
-3.900491
***
X2
-0.517848
不显著
X3
2.078137
*
X4
-0.113917
不显著
X5
1.947647
*
X6
-0.979609
不显著
X7
3.562639
***
说明:
***为在1%上显著,**为在5%上显著,*为10%上显著。
由此可见,R2很大,解释变量不显著,系数是有偏的,所以一定存在共线性。
五、模型的共线性检验与修正
采用逐步回归的办法,去检验和解决多重共线性问题。
分别作Y对X1、X2、X3、X4、X5、X6、x7的一元回归,结果如表5-1所示:
变量
X1
X2
X3
X4
X5
X6
X7
参数估计值
0.099640
1.594046
37.32121
31.80015
107.1900
376.3486
0.504571
t统计量
18.08183
18.38295
28.15334
17.34102
12.83719
22.78655
31.15840
R2
0.934277
0.936276
0.971800
0.928949
0.877525
0.957582
0.976858
按R2的大小进行排序:
X7、X3、X6、X2、X1、X4、X5
以X7为基础,顺次加入其他变量逐步回归,得(括号内为t值)
模型二
㏑Y=-1.050828+0.875629㏑X7+1.419787㏑X3-0.916242㏑X2
(4.793044)(5.320311)(-3.711937)
R2为0.972059,调整R2为0.968068,X7X3X2都在1%上显著,这是消除多重共线性的结果。
六、平稳性、相关性、异方差的检验
6.1平稳性使用单位根检验,使用AugmentedDickey-Fuller统计量
首先是水平序列的检验
变量
T值
P值
是否平稳
y
1.878826
1.0000
水平序列非平稳
X7
-4.652016
0.0061
水平序列平稳
X3
3.327526
1.0000
水平序列非平稳
X1
-3.800765
0.0353
水平序列平稳
我们可以明显看出Y和X3都是水平序列非平稳水平序列非平稳的,所以我们要进行一阶差分,在进行一阶差分的平稳检验
一阶差分检验
变量
T值
P值
是否平稳
y
-3.636361
0.0521
一阶差分平稳
X7
-3.367636
0.0843
一阶差分平稳
X3
-4.159541
0.0185
一阶差分平稳
X1
-4.166217
0.0212
一阶差分平稳
所以我们得出模型3:
YC=β0+β1*(X1C)+β2*(X3C)+β3*(X7C)+µ
YC、X1C、X3C、X7C分别是Y、X1、X3、X7差分后的新变量,用Eviews回归,得(括号内为t值)
YC=1135.321-0.047503X1C+8.575512X3C+0.580951X7C+µ(-2.668205)(2.716673)(5.452057)
X1C、X2C、X3C分别在5%、5%、1%上显著。
R-squared
0.80712
R-squaredAdjustedR-squared
0.778196
6.2相关性的检验
相关性的检验,主要使用DW检验
当du当K=3,N=24时,du=1.66
所以1.66模型三DW检验结果为
Durbin-Watsonstat=1.814714
所以模型三不存在自相关
6.3异方差的检验
异方差的检验主要使用white检验,首先看图形,设E2为残差的平方,画出E2和X1的散点图,图6-1为X1C和E2的散点图。
图6-1
图6-1中,散点图趋近于一条直线,所以猜测不存在异方差,为了进一步确定其准确性,进行怀特检验。
用E2对X1C、X1C^2、X1C*X3C、X1C*X7C、X3C、X3C^2、X3C*X7C、X7C、X7C^2
得,R2=0.586181.
nR2服从卡方分布,所以模型三nR2=14.0664,查卡方分布表可知,不能拒绝原假设,所以是同方差,不存在异方差。
七、结论与建议
(1)从结果来看,学校的教师数与财政对教育的支出是研究生招生人数的关键,其影响是正相关,这是可以预见的,与先前的预测结果一致。
研究生的学习不同本科生期间,是需要导师指导和培养的,所以导师的数量直接关系到了研究生招生的人数,导师越多,自然研究生早生人数就越多了。
(2)而政府财政对教育的支出就更关键了,弹性系数更是大于1,可见是比较重要的因数,国家对教育的投入越大,配置的资源越多,自然就能吸引更多的人报考研究生了。
在如今需要大量高端人才的年代,政府必须重视对教育的投入,财政支出在这个方面是不能省的。
正如前面所说,中国投入到教育的经费占GDP的比率一直低于发达国家水平,国家对教育的投入不足,导致学校以及教师的规模增长缓慢,而随着经济的增长,工作相对好找,所以在经济形式好的时候,本科应届生相对来说更愿意去找工作,而不是考研。
(3)如今在世界经济不景气,欧洲债务危机的时候,人们更愿意投资人力资本,就像巴菲特说的那样,那你的才能才是最好的投资,所以如今考研的人数在逐年增加,而国家过教育的投入增长却没那么快,就造成供求的不平衡,随意我们国家一直缺乏高端人才,也是很多人出国的原因。
(4)在模型三中,应届高校毕业生的系数比较小,可以看出,研究生招生人数和应届高校毕业生的人数关系还是不大的。
原因可能是研究生招生人数主要受学校的教师数与而政府财政对教育的支出为主要影响,上述模型也说明了这一个问问,还有一个就是应届高校毕业生只是研究生的一个供给,如今很多在职人员也回去读研深造,而且越来越普遍,这是另外的供给。
以上两个原因造成了应届高校毕业生系数在统计上显著,经济上不怎么显著的原因。
要改变现状,最重要的是加强对教育的重视,加大投入对教育经费。
加强师资队伍建设,不断提高教学质量。
教师队伍是学校的支柱力量,是提高办学质量的前提,大师级的教授更为关键,因此必须加强师资队伍建设,不断提高教学质量。
第一、必须大力引进人才,特别是引进海外归来的高学历、高职称的专业人士。
通过引进人才既可以壮大师资队伍,同时又可以让他们将国外先进的办学理念、专业知识、操作技能在最短的时间里传授给学生,使我们的学生的专业知识水平尽快与国际同业水平看齐。
第二,为充实、加强第一线教学骨干,确保教学质量,一要延聘、返聘经验丰富、学术水平高、身体健康的老教师继续任教;二要在对教师外出读博、读研和进修实行计划管理,严格控制中青年骨干擅自离开教学岗位;三要实行青年教师进修、培训制度。
第三,积极对现有师资进行培养也是高教发展中不可缺的一项工作,通过自培、委培、交流等方式不断提高现有教师的学历层次和教学水平,建立起具有知识结构新颖、专业有特色的教师队伍和学术队伍。
综上所述,虽然在我国在研究生招生人数上有许多问题。
但是,只要我们坚持以科学发展观为指导积极面对这些问题,采取相应的对策加以解决,不仅会使问题迎刃而解,还将加快我国高等教育的健康发展。
参考文献:
[1]伍德里奇,计量经济学导论[M],第四版,北京:
清华大学出版社,2010
[2]丁凡,曲爽,我国毕业研究生增长趋势模型构建与拟合推测[J],理工高教研究,2010,29
(1),82
[3]国家统计局,中国统计年鉴2010,tjsj/ndsj/2010/indexch.htm,2011-12-14
[4]丁凡,黄晓明,李秀梅,王莉,我国研究生招生及毕业人数发展趋势的
曲线拟合与推测研究[J],论著(卫生管理),2011,24
(1),67
[5]胡俊山,杨玲,高校招生人数影响因素的多元线性回归分析[N],保山学院学报,2010第2期
[6]彭怀祖,高校招生人数影响因素分析及应用[J],教育与经济,2008第2期,32
崔业庆
0944004
该论文系本人所写,不存在抄袭,后果自负。