基于SPSS的公路货运量预测.doc
《基于SPSS的公路货运量预测.doc》由会员分享,可在线阅读,更多相关《基于SPSS的公路货运量预测.doc(28页珍藏版)》请在冰点文库上搜索。
28
目录
第一章问题研究背景 1
1.1、背景综述 1
1.2研究此问题常用的方法 1
1.3本研究采用的方法 2
第二章公路货运量影响因素的描述性分析 3
2.1.不同年份五种运输方式的走势图 3
2.2基础设施的增长趋势 4
2.3总人口数增长趋势 5
2.4经济指标走势图 5
第三章统计模型与分析 7
3.1各个因素对公路货运量影响的相关性分析 7
3.1.2模型原理 7
3.1.2SPSS操作步骤 7
3.1.3输出结果及分析 8
3.2对影响因素以及货运量预测的线性回归 9
3.2.1模型原理 9
3.2.2SPSS操作步骤 10
3.2.3输出结果及分析 10
3.3用曲线拟合预测货运量 15
3.3.1模型原理 15
3.3.2SPSS操作步骤 15
3.3.3输出结果及分析 16
3.2用时间序列分析预测公路客运量 17
3.3.1模型原理 17
3.3.2SPSS操作步骤 18
3.3.3输出结果及分析 20
3.4预测值汇总表 22
第四章总结与分析 23
4.1本文结论 23
4.2需要进一步的完善的问题 23
附录数据清单 25
第一章问题研究背景
1.1、背景综述
改革开放后,我们国民经济持续高速发展,公路运输需求强劲增长,国家加大了公路基础设施的建设力度,随着道路环境的改善和省际、城际以及城乡交流的日益频繁,公路的货运量逐年提高,同时这也直接支持了公路货运行业的发展。
公路货运在我国综合运输体系货运市场中发挥这举足轻重的作用,承担着90%以上的份额,因此对我国公路货运的研究就显得很有现实意义,通过研究我国从进入2000年至今的公路货运量发展变化,可以从我国国民经济发展的一个侧面了解到我国二十多年来的交通运输、公共事业建设、人民生活水平、社会生产、流通、分配、消费各环节协调发展等诸多现实经济问题,对于提升个人对国家经济发展认识,研究分析能力有很大的好处。
1.2研究此问题常用的方法
公路货运量预测技术一般可以分为三大类,定性分析预测技术、定量分析预测技术以及两者相结合的综合预测技术。
定性预测分析技术,通常指那些凭经验判断的预测,一般是在缺少进行定量分析所必需的资料的情况下采用,侧重于研究推断预测对象未来发展的大体趋势和性质,其预测的精确度,主要取决于参与人员的专业知识和经验。
定量分析预测技术,是指以已经掌握的历史数据作为基础,建立适当的经济数学模型,对未来的运量做出测算的技术。
其特点是有明显的数量概念,侧重于研究测算对象的发展程度(包括数量、时间、相关因素的比值等)。
定量预测和定性预测,各有其长处和局限性,实际应用中往往需要把定量预测和定性预测方法相结合,即在定性分析的基础上进行定量预测,而定性预测也采用一定的定量预测分析方法,以提高预测结果的准确性。
因此,综合预测技术是货运量预测经常采用的方法。
1.3本研究采用的方法
本设计采用的预测方法有一元回归分析、多元回归分析、曲线拟合以及时间序列法。
第二章公路货运量影响因素的描述性分析
2.1.不同年份五种运输方式的走势图
图2-1不同年份五种运输方式走势图
由图2-1可以看出五种运输方式的货运量都在逐年增加,公路运输占据的主要市场,并且其增长趋势在明显增加。
铁路运输尽管不占据主要的市场,但是相对于公路运输时一个潜在的威胁,铁路运输价格相对低廉;能实现大宗货物的运输,利用汽车的接驳,完善了服务链,能迎合大量客户的需求;速度不断提高,已实现了“次快件”运输服务,在产品对时间要求不高时,企业将优先选择铁路运输服务。
铁路的提速给公路货物运输带来了越大的威胁。
近年来,我国航空货运基础设施、航线、机场数量等不断改善,为航空货运市场的快速发展创造了有利条件,也使航空货物周转量不断增加。
水路运输数量排第三,由于运输费用较低,舒适性较高,但速度缓慢,受天气影响较大的缺点。
随着高速公路的快速发展,很多沿海城市的公路可达性很高,所以旅客可能更愿意选择门到门公路运输或者更加快捷的航空运输,而尽量避免选择时间成本较高的水路交通方式。
管道具有运能大,连续性强,损耗小,安全,专业性强等特点,几乎不受任何外界条件的影响,所以更适应于能源的运输,但其投资数额较大。
对公路运输几乎不产生影响。
2.2基础设施的增长趋势
图2-2公路里程、载货汽车数的年走势
一般来说,公路里程越长,载货汽车数数越多,公路货物运输的可达性就越强,提供的运输能力越强,货运量应该越大。
由图可以看出,公路路程增长的趋势趋于平缓,在2004-2005年间快速增长,由于国土面积的限制,公路里程的增长将无限接近一个数值,因此随着时间的推进,增长的速度越来越慢。
观察载货车辆的增长趋势线可以得到,在2001-2008年间的增长趋势大致相同,在2008至2010年间的增长趋势陡增。
2.3总人口数增长趋势
图2-3总人口数增长趋势
人口数量的变化必然引起对运输总量需求的变化,人口增加对奢侈品、鲜活物品需求的增多,对公路运输的需求也势必增加,因此应该会对公路货运量起到正向影响的作用。
由上图2-2可以看出在2001年至2010年间总人口数的不断增多,但是增长速度有所放缓。
2.4经济指标走势图
图2-4经济指标走势图
国内生产总值反映一个国家的经济表现,更可以反映一国的国力与财富。
随着经济的发展,人民对于交通运输的需求也随之增长,因此对公路运输的需求也会增长。
有图可知,GDP及其增长速度在逐年增加,这反映了我的综合国力也在稳步提升。
消费品零售额反映一定时期内人民物质文化生活水平的提高情况,反映社会商品购买力的实现程度。
我国消费品零售总额58年增长了321.9倍,说明市场规模逐渐加大,由此对交通运输业需求增加,从而使公路货运量增加。
由图可以知道社会消费品零售总额也在逐年增加,并且增长速度不断变大。
第三章统计模型与分析
3.1各个因素对公路货运量影响的相关性分析
3.1.2模型原理
所谓相关就是指事物、现象之间的相互关系。
在事物、现象之间,往往存在着一定的关系,一事物的变化,常引起另一事物也发生变化,或者许多事物因受某种因素的影响,同时都在变化。
比如教育事业的发展与科学技术的发展存在着一定的关系;人的身高与体重存在着一定的关系;学生的数学成绩与物理成绩存在着一定的关系等等。
统计学中的相关就是要从数量方面来研究两种或两种以上变量之间的关系。
3.1.2SPSS操作步骤
①按分析——相关——双变量打开双变量相关对话框
②在左侧源变量框中进行如下操作然后点击“确定”按钮,如图所示
3.1.3输出结果及分析
描述性统计量
均值
标准差
N
公路货运量
1551778.500
472603.8656
10
公路里程
291.2860
98.85369
10
载货汽车
1041.210
262.5116
10
总人口数
130999.500
2172.7875
10
GDP
224890.130
101219.5490
10
社会消费品零售总额
84878.490
38809.0406
10
相关性
公路货运量
公路里程
载货汽车
总人口数
GDP
社会消费品零售总额
公路货运量
Pearson相关性
1
.856**
.983**
.947**
.993**
1.000**
显著性(双侧)
.002
.000
.000
.000
.000
N
10
10
10
10
10
10
公路里程
Pearson相关性
.856**
1
.809**
.938**
.897**
.867**
显著性(双侧)
.002
.005
.000
.000
.001
N
10
10
10
10
10
10
载货汽车
Pearson相关性
.983**
.809**
1
.914**
.962**
.981**
显著性(双侧)
.000
.005
.000
.000
.000
N
10
10
10
10
10
10
总人口数
Pearson相关性
.947**
.938**
.914**
1
.972**
.954**
显著性(双侧)
.000
.000
.000
.000
.000
N
10
10
10
10
10
10
GDP
Pearson相关性
.993**
.897**
.962**
.972**
1
.995**
显著性(双侧)
.000
.000
.000
.000
.000
N
10
10
10
10
10
10
社会消费品零售总额
Pearson相关性
1.000**
.867**
.981**
.954**
.995**
1
显著性(双侧)
.000
.001
.000
.000
.000
N
10
10
10
10
10
10
**.在.01水平(双侧)上显著相关。
由上表可以得到公路里程、载货车辆、总人口数、GDP、社会消费品零售总额与公路货运量的p值均小于0.05,拒接显著性假设,说明以上五个因素对公路货运量均有显著影响。
3.2对影响因素以及货运量预测的线性回归
3.2.1模型原理
回归分析主要的任务是在考察变量直接的数量依存关系的基础上,通过一定的数学表达式将这种关系描述出来,进而确定一个活几个变量(自变量)对另一个变量(因变量)的影响程度。
一元线性回归方程反应一个因变量与一个自变量之间的线性关系,当直线方程的a和b确定时,即为一元回归线性方程。
经过相关分析后,在直角坐标系中将大量数据绘制成散点图,这些点不在一条直线上,但可以从中找到一条合适的直线,使各散点到这条直线的纵向距离之和最小,这条直线就是回归直线,这条直线的方程叫做直线回归方程。
3.2.2SPSS操作步骤
①按分析——回归----线性打开线性回归对话框
②在左侧源变量框中选择GDP作为因变量,将其送入因变量框,选择作年份为自变量,将其送入自变量框,然后点击“确定”按钮,如图所示
图3-1
③在分析完五个因素跟年份的关系后,再用五个因素跟公路货运量进行多元线性回归,得到并分析结果。
3.2.3输出结果及分析
模型汇总
模型
R
R方
调整R方
标准估计的误差
1
.980a
.961
.956
21143.6723
a.预测变量:
(常量),年份。
Anovaa
模型
平方和
df
均方
F
Sig.
1
回归
88632134925.953
1
88632134925.953
198.258
.000b
残差
3576439012.148
8
447054876.519
总计
92208573938.101
9
a.因变量:
GDP
b.预测变量:
(常量),年份。
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准误差
试用版
1
(常量)
-65509297.073
4668491.321
-14.032
.000
年份
32776.957
2327.842
.980
14.080
.000
a.因变量:
GDP
表3-12011-2017的GDP预测
2011
2012
2013
2014
2015
2016
2017
405163.5
437940.4
470717.4
503494.3
536271.3
569048.2
601825.2
同理,得出公路里程、载货车辆、总人口数与年份的回归方程以及预测分别为:
,其中为年份,为公路里程。
表3-22011-2017的公路里程预测
2011
2012
2013
2014
2015
2016
2017
458.749
489.241
519.733
550.225
580.717
611.209
641.701
,其中为年份,为载货车辆。
表3-32011-2017载货车辆的预测
2011
2012
2013
2014
2015
2016
2017
1483.587
1563.964
1644.341
1724.718
1805.095
1885.472
1965.849
,其中为年份,为总人口数。
表3-42011-2017总人口数预测
2011
2012
2013
2014
2015
2016
2017
134942.3
135659.3
136376.4
137093.4
137810.5
138527.5
139244.6
,其中为社会消费品零售总额,为总人口数。
表3-52011-2017社会消费品零售总额预测
2011
2012
2013
2014
2015
2016
2017
152939.7
165314.6
177689.5
190064.4
202439.3
214814.2
227189.1
然后对五个因素进行多远线性回归,得到如下结果。
输入/移去的变量a
模型
输入的变量
移去的变量
方法
1
社会消费品零售总额,公路里程,总人口数,载货汽车,GDPb
.
输入
a.因变量:
公路货运量
b.已输入所有请求的变量。
模型汇总b
模型
R
R方
调整R方
标准估计的误差
1
1.000a
1.000
1.000
6788.4825
a.预测变量:
(常量),社会消费品零售总额,公路里程,总人口数,载货汽车,GDP。
b.因变量:
公路货运量
Anovaa
模型
平方和
df
均方
F
Sig.
1
回归
2010005390328.415
5
402001078065.683
8723.320
.000b
残差
184333976.085
4
46083494.021
总计
2010189724304.500
9
a.因变量:
公路货运量
b.预测变量:
(常量),社会消费品零售总额,公路里程,总人口数,载货汽车,GDP。
系数a
模型
非标准化系数
标准系数
t
Sig.
B的95.0%置信区间
B
标准误差
试用版
下限
上限
1
(常量)
2054512.833
817018.062
2.515
.066
-213892.967
4322918.633
公路里程
-78.303
71.724
-.016
-1.092
.336
-277.440
120.834
载货汽车
12.973
74.924
.007
.173
.871
-195.050
220.997
总人口数
-12.130
6.606
-.056
-1.836
.140
-30.472
6.211
GDP
-.010
.571
-.002
-.017
.987
-1.596
1.576
社会消费品零售总额
12.934
1.669
1.062
7.751
.001
8.301
17.567
a.因变量:
公路货运量
残差统计量a
极小值
极大值
均值
标准偏差
N
预测值
1058813.000
2443985.250
1551778.500
472582.1963
10
残差
-7856.0142
5626.3730
.0000
4525.6550
10
标准预测值
-1.043
1.888
.000
1.000
10
标准残差
-1.157
.829
.000
.667
10
a.因变量:
公路货运量
可得出线性回归方程将一元线性回归的结果代入到此方程中,得到下列货运量的预测值:
表3-62011-2017货运量预测值
2011
2012
2013
2014
2015
2016
2017
2375058
2524745
2674431
2824118
2973804
3123491
3273177
3.3用曲线拟合预测货运量
3.3.1模型原理
曲线估计用在因变量与自变量与一个已知或未知的的曲线或者非线性函数关系相联系的情况下,在很多情况下有两个相关的变量,用户希望用其中一个变量对另一个变量进行预测,但是又不能马上根据记录数据确定一种最佳模型,此时可以用曲线估计在众多回归模型中建立一个既简单又比较适合的模型,又根据对世界主要国家小汽车拥有量变化过程的分析可以发现绝大部分国家的小汽车千人拥有量与该国家的人均收入呈S形曲线的变化趋势。
因此选用S型曲线拟合,自变量为城市常住人口人均收入,因变量为机动车总量。
3.3.2SPSS操作步骤
①按分析——回归----曲线估计打开曲线估计对话框
②在左侧源变量框中选择公路货运量作为因变量,将其送入因变量框,选择GDP为自变量,将其送入自变量框,
③然后将模型框中选择多种方法进行拟合,并点击“确定”按钮,如图所示
图3-3
3.3.3输出结果及分析
模型描述
模型名称
MOD_6
因变量
1
公路货运量
方程
1
对数
2
三次
3
幂a
4
指数a
自变量
GDP
常数
包含
其值在图中标记为观测值的变量
未指定
用于在方程中输入项的容差
.0001
a.该模型要求所有非缺失值为正数。
个案处理摘要
N
个案总数
10
已排除的个案a
0
已预测的个案
0
新创建的个案
0
a.从分析中排除任何变量中带有缺失值的个案。
变量处理摘要
变量
因变量
自变量
公路货运量
GDP
正值数
10
10
零的个数
0
0
负值数
0
0
缺失值数
用户自定义缺失
0
0
系统缺失
0
0
模型汇总和参数估计值
因变量:
公路货运量
方程
模型汇总
参数估计值
R方
F
df1
df2
Sig.
常数
b1
b2
b3
对数
.926
99.585
1
8
.000
-10619288.242
995132.016
三次
.998
827.611
3
6
.000
798750.743
2.022
4.091E-006
2.980E-012
幂
.972
280.182
1
8
.000
718.248
.625
指数
.998
3675.040
1
8
.000
785122.235
2.856E-006
自变量为GDP。
图3-4
由上图中的可知,三次与指数在此范围内都拟合的较好,但是根据指数的发展趋势可以排除指数拟合,因此选择三次的曲线估计。
根据三次曲线模型可以得到方程:
表3-7对2011-2017的公路货运量的预测
2011
2012
2013
2014
2015
2016
2017
2487761
2719187
2967816
3234276
3519199
3823212
4146947
3.2用时间序列分析预测公路客运量
3.3.1模型原理
从统计意义上讲,时间序列是将一个变量在不同时间上的不同数值按时间先后排列而成的数列。
从数学意义上讲,设Xt(t∈T)是一个随机过程,Xt(i=1,2,……,n)是在Xt在时刻i对过程Xt的观察值,则称Xt为一次样本实现,也就是一个时间序列。
从系统意义上讲,时间序列就是某一系统在不同时间(地点、条件等)的响应。
3.3.2SPSS操作步骤
①按分析——预测----创建模型打开创建模型对话框
②在左侧源变量框中选择公路货运量、载货汽车、公路里程、总人口数、GDP作为因变量,将其送入因变量框,选择年份作为自变量,将其送入自变量框。
在方法一框中选择ARIMA,并设置条件中模型的几个值分别为2、1、1,然后点继续。
接着在统计表选项中选中显示预测值、拟合优度等选项。
③然后将模型框中选择多种方法进行拟合,并点击“确定”按钮,如图所示。
图3-5
图3-6
图3-7
3.3.3输出结果及分析
模型描述
模型类型
模型ID
公路货运量
模型_1
ARIMA(2,1,1)
公路里程
模型_2
ARIMA(2,1,1)
载货汽车
模型_3
ARIMA(2,1,1)
总人口数
模型_4
ARIMA(2,1,1)
GDP
模型_5
ARIMA(2,1,1)
社会消费品零售总额
模型_6
ARIMA(2,1,1)
模型统计量
模型
预测变量数
模型拟合统计量
Ljung-BoxQ(18)
离群值数
平稳的R方
R方
统计量
DF
Sig.
公路货运量-模型_1
1
.914
.996
.
0
.
0
公路里程-模型_2
1
.279
.831
.
0
.
0
载货汽车-模型_3
1
.740
.974
.
0
.
0
总人口数-模型_4
1
.967
1.000
.
0
.
0
GDP-模型_5
1
.906
.997
.
0
.
0
社会消费品零售总额-模型_6
1
.940
.998
.
0
.
0
预测
模型
2011
2012
2013
2014
2015
2016
2017
公路货运量-模型_1
预测
2.7E+006
3.1E+006
3.5E+006
3.9E+006
4.3E+006
4.8E+006
5.3E+006
UCL
2.8E+006
3.2E+006
3.6E+006
4.0E+006
4.5E+006
4.9E+006
5.5E+006
LCL
2.6E+006
3.0E+006
3.4E+006
3.8E+006
4.2E+006
4.7E+006
5.2E+006
公路里程-模型_2
预测
446.14
480.60
502.06
521.48
542.92
564.63
584.90
UCL
584.63
629.87
650.58
669.43
690.68