多元线性回归法在粮食产量预测中的应用.doc
《多元线性回归法在粮食产量预测中的应用.doc》由会员分享,可在线阅读,更多相关《多元线性回归法在粮食产量预测中的应用.doc(19页珍藏版)》请在冰点文库上搜索。
多元线性回归法在粮食产量预测中的应用
摘要
近几年我国粮食总产量呈不断上升趋势,但增长的幅度却在逐年减缓,我国农业经济状况不容乐观,所以有必要对我国粮食产量状况做相应的研究.本文采用多元线性回归法对我国粮食总量量进行分析和预测,引用1992年—2013年的粮食作物种植面积、农业机械总动力、有效灌溉面积、化肥施用量、国家财政用于农业的资金、农村劳动力和粮食受灾面积等7个因素作为自变量,对我国粮食总产量进行多元线性回归分析,并采用已通过优化检验的模型对我国粮食产量进行预测,探索保持农业经济持续发展的有效途径.
关键词:
粮食产量多元线性回归预测
Applicationofmultivariatelinearregressionmethodintheforecastofgrainoutput
Directedbylecturer
ABSTRACT
Inrecentyears,China'stotalgrainoutputisrising,butthegrowthratewasslowdownyearbyyear,agriculturaleconomydirectlyfacingahugecrisis,soitisnecessarytomakethecorrespondinganalysisandpredictionofgrainyieldinChina.ThismethodisthatusingthemultiplelinearregressionanalysistostudyChina'stotalgrainfromthe1992to2013,theareaofgraincrops,thetotalpowerofagriculturalmachinery,effectiveirrigationarea,theamountofchemicalfertilizer,thestatefinancialfundsforagriculture,rurallabor,disasterareaofthe7factorsasindependentvariables,studyingChina'stotalgrainoutputbymultiplelinearregressionanalysis,andbyusingthegrainyieldofourcountrytooptimizethetestmodel,exploringtheeffectivewaytomaintainthesustainabledevelopmentofagriculturaleconomy.
KEYWORDS:
Grainyieldmultiplelinearregressionprediction
I
目录
摘 要 I
英文摘要 II
前 言 1
1粮食作物种植环境 2
1.1地理分布 2
1.2气候 2
1.3土壤 2
2我国农业经济状况 3
3粮食产量的多元回归分析 3
3.1模型的设定 3
3.2变量的定义 4
3.3经济计量模型的建立 4
3.4多元共线性的检验 6
3.5多元共线性的修正 6
3.6结论与预测 11
4有效提高粮食产量的对策 12
参考文献 13
致谢 14
附录 15
前言
众所周知,粮食是人类的生命得以延续的最基本的物质条件,没有粮食,人类将无法生存下去.同样,没有粮食,一个国家的生存兴旺也会受到威胁.2014年根据国家统计局对我国31个省份(区,市)农业生产户的调查和农业经营单位的统计得出:
我国粮食总产量为60709.9万吨,比2013年增加516万吨,粮食作物种植面积为112738.3千公顷,比2013年增加了782.7公顷,粮食作物单位面积的产量则是5385公斤/公顷,比2013年增加了8.4公斤/公顷[1].
如果回顾我国粮食的生产情况我们会发现,随着科技水平的提高和社会的发展,我国粮食总产量虽然呈总体上涨趋势,但是增长的幅度却在逐年减缓,我国农业经济状况不容乐观,因此,对我国粮食总产量的研究就显得很有必要性,以此探索我国粮食产量稳定增长的有效方法,保证我国国民经济的持续发展.对我国粮食总产量进行分析预测,实际上有利于耕种者更有效的利用有限的耕地面积进行合理的种植,增加粮食产量,也有利于研究者更清晰的认识到中国粮食现在的状况,针对性的提出改革方案便于国家出台更多的能够加快农业发展的政策.
目前国内外的学者对粮食产量的研究很多,比如:
国外学者通过分析降水的季节性对冬小麦生长的影响,对冬小麦的生长状况进行了研究.而在中国,由于我国地域宽广,粮食的种类又多,所以国内的学者主要研究全国性的粮食和区域性的粮食情况.例如:
在研究全国性的粮食时,刘晶等人通过灰色关联理论对影响我国粮食的主要因素进行了分析,阐述了粮食产量与影响因素之间的相互关系,而本文则主要针对我国全国的粮食产量进行多元回归分析预测,预设影响我国粮食总产量的各个因素从更多角度更多层次上研究我国粮食产量.
而随着科学技术的不断进步,统计方法越来越成为人们不可缺少的解决问题的手段,而回归分析便是其中的一个非常重要的分支[2].许多社会经济现象都会受各种因素的影响所以他们之间的相互关系大多都是随机的,往往很难用确定的函数关系来表示,要通过统计分析才能找到其中隐藏的规律,同时,当对市场各种现象的未来状况进行预测时,如果能将预测对象的主要因素找到,并能够取得相关资料,就能用回归分析进行预测了,因此,回归分析法便成为了一种重要的市场预测方法[3].
1粮食作物种植环境
1.1地理分布
我国的地形复杂,其中高原、丘陵和山地占有很大比重.首先位于我国西部的是青藏高原,高原上屹立着许多著名的山系,其中就有被称为世界第一高峰的珠穆朗玛峰.我国东部是广阔的平原,其间也散落着许多低山、中山和丘陵.我国自然条件的多样性和复杂性,使我国地形地貌具有世界罕见的独特性.特别是青藏高原,它的平均海拔为4500米,大约有我国国土面积的1/4[4].青藏高原的存在打坏了通常的水平地带结构,高原上的植被也与同纬度低海拔处的不同,属于垂直地带性的高寒类型.即使类型相似的植被在高原上分布的海拔界限也要比同一纬度的高很多,植被的旱生性也同样比同纬度的厉害.
1.2气候
我国的气候属于季风性,且波及范围广阔[5].季风的影响的范围和强弱,每年不同,每月也不同,但是季风在我国一年中的南北推移,却对我国的景观的形成起着关键的作用.并且我国东部季风区自然地带的南北变化及西部和东部的差异,很大部分上受季风的控制.我国有广阔的面积属于亚热带,从北到南跨纬度有12°,同时我国亚热带的植物在全世界所占的面积也是非常大的.然而我国广大的亚热带地区并不像世界其他同纬度地区那样分布着草原或者荒漠,因为季风的作用,在高温季节的时候,降水会很充沛,气候也会变得温暖湿润,是世界上有名的农业发达地区.
1.3土壤
我国平原地区的土壤比较肥沃,分为南方的红壤和东北的黑土,不过也有荒漠化的现象,比如在新疆,我国土地沙漠化的现象就很严重.我国高原地区的土壤沙漠化同样很严重,比如黄土高原.并且我国土壤污染现象也很严重,我国受砷、镉、铅等重金属污染的耕地面积有2000万公顷之多,其中因为工业而污染的耕地面积多达1000万公顷,用污水灌溉的农田面积甚至多达330万公顷,对农田已造成了大面积的土壤污染.如天津境内因为污水灌溉而导致的农田污染达2.3万公顷,广州地区则有2700公顷的农田因为污水灌溉被污染,污染面积要占广州全部耕地面积的46%[6].我国耕地土壤状况不容乐观.
2我国农业经济状况
改革开放以来,我国农业的经济结构发生了天翻地覆的变化,首先,我国的农产品从以往的短缺现象发展到了现在的供大于求,但因此产生的市场也存出现了大量的矛盾和问题,农民所得到的经济效益不断下降.我国农业经济存在的问题有以下几点 :
农产品供给和需求结构严重失衡 ,建国以来,我国农业的生产能力不断提高,农产品已经形成供过于求的局面.而现在,我国粮食自给能力也大大增强,主要的农业产品基本全部供大于求,甚至出现滞销的现象,以至于我国不得不在小麦、水稻、玉米的主要产业区实行最低保护价政策.
农业产品区域分布不合理,从全国来看,近几年的农产业结构进展并不平衡,并且我国各地并没有充分发挥自己地区的有利条件,没有形成有独特特色的农产品地区.同时,农业产业结构仅在狭小的地区内进行调整,在较大范围内的产业和产品没有表现出相同的结构性.
据悉,我国耕地乱占、荒漠化等现象正在吞食着我国的种植面积,耕地与粮食的减少速度在不断加快.在2009年至2012年间我国耕地面积数据的变化呈现出一条下滑的曲线.2009年耕地面积为13538.46万公顷,2012年为13515.85万公顷,而在2013年全国整体减少8.02万公顷耕地面积[7].我国耕地和粮食种植面积几乎到了不能再继续减少的临界水平了.并且依据相关报告,我国未来20年,人口总数还会继续增加,到2033年前后到达15亿的峰值后才会缓慢下降,人口的增加将会推动我国粮食需求总量的增长,这也将使我国粮食产量需求形势在相当一段时期内更加趋于严峻.
3粮食产量的多元回归分析
3.1模型的设定
影响粮食生产的因素很多,有劳动力、物质投入、土地、生产方式、技术进步、生产结构、制度因素、气候变化和自然灾害等等因素都影响着粮食产量.为了基本涵盖这些基本因素,本文选择了以,粮食作物种植面积,农业机械总动力,有效灌溉面积,化肥施用量,国家财政用于农业的资金,农村劳动力,粮食受灾面积7个变量为解释变量,以粮食总产量为被解释变量.对于这些影响因素,我找到了1992到2013年的关于这些因素的数据,借此来分析预测中国粮食产量趋势,以下是我对所找的数据做的一些说明.
1)粮食总产量,作为被解释变量,从表中我们可以知道它是波动不定的,但总体趋势还是增长的.
2)粮食作物种植面积,随着播种面积的减少,粮食产量也会相应的减产,二者成正相关的关系.
3)农业机械总动力,包括耕作机械、收获机械、农用运输机械、牧业机械、林业机械、渔业机械和其他农业机械等[8].它的增加会使粮食产量增加.
4)有效灌溉面积,一般情况下有效灌溉面积等价于灌溉工程或设备已经配备,能够进行水浇地面积和正常灌溉的水田之和[9].它是反映我国耕地抗旱能力的一个重要指标.与粮食产量成正相关.
5)化肥施用量,化肥施用量与粮食产量之间存在较强的正相关关系;化肥投入是影响粮食产量增长的重要因素.
6)国家财政用于农业的资金,农业财政资金是指国家用于农业的各种财政支出,主要用于农业的各种补贴、事业费等支出[10].与粮食产量呈正相关.
7)农村劳动力,农村劳动力是指乡村人口中年龄在16岁以上、经常参加集体经济组织和家庭副业劳务的劳动力.劳动力的增加会间接促进粮食的产量.
8)粮食受灾面积,受灾面积指受灾害影响造成农作物产量损失一成以上的面积(如果同一地块的当季农作物多次受同一种灾害的危害,只计算其中受灾最重的一次),受灾面积的增加会使粮食产量减少,它们是负相关的关系.
3.2变量的定义
假设粮食产量与粮食作物种植面积,农业机械总动力,有效灌溉面积,化肥施用量,国家财政用于农业的资金,农村劳动力,粮食受灾面积7个变量之间存在线性关系,其中 :
表1变量的定义
表示粮食产量(万吨)
粮食作物种植面积(千公顷)
表示农业机械总动力(万千瓦)
表示有效灌溉面积(千公顷)
表示化肥施用量(万吨)
国家财政用于农业的资金(亿)
农村劳动力(万人)
受灾面积(千公顷)
3.3经济计量模型的建立
以2014年版的《中国统计年鉴2014》为资料来源,使用1991年到2013年的中国粮食产量和粮食作物种植面积,农业机械总动力,有效灌溉面积,化肥施用量,国家财政用于农业的资金,农村劳动力,粮食受灾面积等数据建立EXCEL数据表,运用EXCEL2003回归软件对影响粮食产量进行实证分析.
建立粮食产量与粮食作物种植面积,农业机械总动力,有效灌溉面积,化肥施用量,国家财政用于农业的资金,农村劳动力,粮食受灾面积7个变量之间的多元线性回归模型:
其中:
是待定参数.
是随机误差项 ,样本大小:
, 总平方和的自由度:
,回归平方和的自由度:
(解释变量的个数) ,残差平方和的自由度:
.
采用已搜集的数据对模型进行回归分析,初步多元回归结果见表2.
表2初步多元回归结果
回归统计
MultipleR
0.99481349
RSquare
0.98965388
AdjustedRSquare
0.98482569
标准误差
599.935586
观测值
23
方差分析
df
SS
MS
F
SignificanceF
回归分析
7
516423784.8
73774826.4
204.974082
9.81451E-14
残差
15
5398840.612
359922.7075
总计
22
521822625.4
Coefficients
标准误差
tStat
P-value
Intercept
10417.1852
36830.42193
0.282841865
0.78116389
X1
0.53980936
0.062478155
8.639969637
3.2961E-07
X2
-0.0102626
0.142350634
-0.07209395
0.94347964
X3
-0.1760577
0.253072699
-0.69568018
0.49726682
X4
6.95106514
1.341323348
5.182244197
0.00011148
X5
0.23646016
0.238450737
0.991652049
0.33709538
X6
-0.7352703
0.87692815
-0.83846131
0.41493366
X7
-0.1137717
0.028988093
-3.92477297
0.00135122
由表2可得,初步回归的多元线性模型为:
该模型中拟合优度即决定系数为=0.990,调整后的决定系数为=0.985,说明回归的拟合程度很高,但是当对各自变量的回归系数进行检验时,检验的P值均大于显著性水平(),即检验不通过,以上变量对粮食产量的影响均不显著,而且农业机械总动力、农村劳动力、有效灌溉面积均与粮食产量成负相关,与经济意义不符,这表明可能存在很严重的多重共线性.
3.4多重共线性的的检验
通过SPSS18.0统计软件,计算各解释变量的相关系数,得到相关系数矩阵见表3.
表3各变量之间的相关性
粮食总产量
粮食作物种植面积
农业机械总动力
有效灌溉面积
化肥施用量
国家财政用于农业的资金
农村劳动力
受灾面积
Pearson相关性
粮食总产量
1.000
.370
.817
.841
.822
.896
.768
-.798
粮食作物种植面积
.370
1.000
-.177
-.119
-.192
.113
-.266
.011
农业机械总动力
.817
-.177
1.000
.991
.983
.924
.991
-.798
有效灌溉面积
.841
-.119
.991
1.000
.979
.928
.979
-.781
化肥施用量
.822
-.192
.983
.979
1.000
.871
.990
-.771
国家财政用于农业的资金
.896
.113
.924
.928
.871
1.000
.868
-.826
农村劳动力
.768
-.266
.991
.979
.990
.868
1.000
-.763
受灾面积
-.798
.011
-.798
-.781
-.771
-.826
-.763
1.000
由相关系数矩阵可以看出,各解释变量相互之间的相关系数较高,证实确实存在多重共线性.
3.5多重共线性的修正
采用逐步回归的方法对多元回归模型进行优化.
(1)首先,进行Y对X1的一元回归结果见表4.
表4Y对X1的一元回归结果
回归统计
MultipleR
0.369992461
RSquare
0.136894421
AdjustedRSquare
0.095794156
标准误差
4631.095824
观测值
23
方差分析
df
SS
MS
F
SignificanceF
回归分析
1
71434606
71434606.4
3.33074298
0.082255
残差
21
450388019
21447048.5
总计
22
521822625
Coefficients
标准误差
tStat
P-value
Intercept
-598.721983
27479.719
-0.0217878
0.98282294
X1
0.461272264
0.2527474
1.82503232
0.08225501
Y对X2的一元回归的结果,见表5.
表5Y对X2的一元回归结果
回归统计
MultipleR
0.817445768
RSquare
0.668217584
AdjustedRSquare
0.652418421
标准误差
2871.299452
观测值
23
方差分析
df
SS
MS
F
SignificanceF
回归分析
1
348691054
348691054
42.2944936
1.92E-06
残差
21
173131571
8244360.54
总计
22
521822625
Coefficients
标准误差
tStat
P-value
Intercept
39493.78121
1654.0963
23.8763491
1.0564E-16
X2
0.163521501
0.0251439
6.50342168
1.9196E-06
Y对X3的一元回归的结果,见表6.
表6Y对X3的一元回归结果
回归统计
MultipleR
0.841326
RSquare
0.70783
AdjustedRSquare
0.693917
标准误差
2694.448
观测值
23
方差分析
df
SS
MS
F
SignificanceF
回归分析
1
3.69E+08
3.69E+08
50.8759
4.92E-07
残差
21
1.52E+08
7260050
总计
22
5.22E+08
Coefficients
标准误差
tStat
P-value
Intercept
1829.542
6709.937
0.272662
0.787776
X3
0.874616
0.12262
7.132735
4.92E-07
Y对X4的一元回归的结果,见表7.
表7Y对X4的一元回归的结果
回归统计
MultipleR
0.821653
RSquare
0.675113
AdjustedRSquare
0.659642
标准误差
2841.306
观测值
23
方差分析
df
SS
MS
F
SignificanceF
回归分析
1
3.52E+08
3.52E+08
43.63785
1.53E-06
残差
21
1.7E+08
8073020
总计
22
5.22E+08
Coefficients
标准误差
tStat
P-value
Intercept
30366.83
2959.566
10.26057
1.23E-09
X4
4.316485
0.653429
6.605895
1.53E-06
Y对X5的一元回归的结果,见表8.
表8Y对X5的一元回归的结果
回归统计
MultipleR
0.896008
RSquare
0.802831
AdjustedRSquare
0.793442
标准误差
2213.459
观测值
23
方差分析
df
SS
MS
F
SignificanceF
回归分析
1
4.19E+08
4.19E+08
85.5074
7.49E-09
残差
21
1.03E+08
4899403
总计
22
5.22E+08
Coefficients
标准误差
tStat
P-value
Intercept
45697.1
619.7443
73.73542
7.6E-27
X5
1.065412
0.115217
9.247021
7.49E-09
Y对X6的一元回归结果,见表9.
表9Y对X6的一元回归的结果
回归统计
MultipleR
0.768323
RSquare
0.59032
AdjustedRSquare
0.570811
标准误差
3190.615
观测值
23
方差分析
df