基于SPSS的公路货运量预测.doc

资源描述

基于SPSS的公路货运量预测.doc

《基于SPSS的公路货运量预测.doc》由会员分享，可在线阅读，更多相关《基于SPSS的公路货运量预测.doc（28页珍藏版）》请在冰点文库上搜索。

基于SPSS的公路货运量预测.doc

第一章问题研究背景 1

1.1、背景综述 1

1.2研究此问题常用的方法 1

1.3本研究采用的方法 2

第二章公路货运量影响因素的描述性分析 3

2.1.不同年份五种运输方式的走势图 3

2.2基础设施的增长趋势 4

2.3总人口数增长趋势 5

2.4经济指标走势图 5

第三章统计模型与分析 7

3.1各个因素对公路货运量影响的相关性分析 7

3.1.2模型原理 7

3.1.2SPSS操作步骤 7

3.1.3输出结果及分析 8

3.2对影响因素以及货运量预测的线性回归 9

3.2.1模型原理 9

3.2.2SPSS操作步骤 10

3.2.3输出结果及分析 10

3.3用曲线拟合预测货运量 15

3.3.1模型原理 15

3.3.2SPSS操作步骤 15

3.3.3输出结果及分析 16

3.2用时间序列分析预测公路客运量 17

3.3.1模型原理 17

3.3.2SPSS操作步骤 18

3.3.3输出结果及分析 20

3.4预测值汇总表 22

第四章总结与分析 23

4.1本文结论 23

4.2需要进一步的完善的问题 23

附录数据清单 25

第一章问题研究背景

1.1、背景综述

改革开放后，我们国民经济持续高速发展，公路运输需求强劲增长，国家加大了公路基础设施的建设力度，随着道路环境的改善和省际、城际以及城乡交流的日益频繁，公路的货运量逐年提高，同时这也直接支持了公路货运行业的发展。

公路货运在我国综合运输体系货运市场中发挥这举足轻重的作用，承担着90%以上的份额，因此对我国公路货运的研究就显得很有现实意义，通过研究我国从进入2000年至今的公路货运量发展变化，可以从我国国民经济发展的一个侧面了解到我国二十多年来的交通运输、公共事业建设、人民生活水平、社会生产、流通、分配、消费各环节协调发展等诸多现实经济问题，对于提升个人对国家经济发展认识，研究分析能力有很大的好处。

1.2研究此问题常用的方法

公路货运量预测技术一般可以分为三大类，定性分析预测技术、定量分析预测技术以及两者相结合的综合预测技术。

定性预测分析技术，通常指那些凭经验判断的预测，一般是在缺少进行定量分析所必需的资料的情况下采用，侧重于研究推断预测对象未来发展的大体趋势和性质，其预测的精确度，主要取决于参与人员的专业知识和经验。

定量分析预测技术，是指以已经掌握的历史数据作为基础，建立适当的经济数学模型，对未来的运量做出测算的技术。

其特点是有明显的数量概念，侧重于研究测算对象的发展程度（包括数量、时间、相关因素的比值等）。

定量预测和定性预测，各有其长处和局限性，实际应用中往往需要把定量预测和定性预测方法相结合，即在定性分析的基础上进行定量预测，而定性预测也采用一定的定量预测分析方法，以提高预测结果的准确性。

因此，综合预测技术是货运量预测经常采用的方法。

1.3本研究采用的方法

本设计采用的预测方法有一元回归分析、多元回归分析、曲线拟合以及时间序列法。

第二章公路货运量影响因素的描述性分析

2.1.不同年份五种运输方式的走势图

图2-1不同年份五种运输方式走势图

由图2-1可以看出五种运输方式的货运量都在逐年增加，公路运输占据的主要市场，并且其增长趋势在明显增加。

铁路运输尽管不占据主要的市场，但是相对于公路运输时一个潜在的威胁，铁路运输价格相对低廉；能实现大宗货物的运输，利用汽车的接驳，完善了服务链，能迎合大量客户的需求；速度不断提高，已实现了“次快件”运输服务，在产品对时间要求不高时，企业将优先选择铁路运输服务。

铁路的提速给公路货物运输带来了越大的威胁。

近年来，我国航空货运基础设施、航线、机场数量等不断改善，为航空货运市场的快速发展创造了有利条件，也使航空货物周转量不断增加。

水路运输数量排第三，由于运输费用较低，舒适性较高，但速度缓慢，受天气影响较大的缺点。

随着高速公路的快速发展，很多沿海城市的公路可达性很高，所以旅客可能更愿意选择门到门公路运输或者更加快捷的航空运输，而尽量避免选择时间成本较高的水路交通方式。

管道具有运能大，连续性强，损耗小，安全，专业性强等特点，几乎不受任何外界条件的影响，所以更适应于能源的运输，但其投资数额较大。

对公路运输几乎不产生影响。

2.2基础设施的增长趋势

图2-2公路里程、载货汽车数的年走势

一般来说，公路里程越长，载货汽车数数越多，公路货物运输的可达性就越强，提供的运输能力越强，货运量应该越大。

由图可以看出，公路路程增长的趋势趋于平缓，在2004-2005年间快速增长，由于国土面积的限制，公路里程的增长将无限接近一个数值，因此随着时间的推进，增长的速度越来越慢。

观察载货车辆的增长趋势线可以得到，在2001-2008年间的增长趋势大致相同，在2008至2010年间的增长趋势陡增。

2.3总人口数增长趋势

图2-3总人口数增长趋势

人口数量的变化必然引起对运输总量需求的变化，人口增加对奢侈品、鲜活物品需求的增多，对公路运输的需求也势必增加，因此应该会对公路货运量起到正向影响的作用。

由上图2-2可以看出在2001年至2010年间总人口数的不断增多，但是增长速度有所放缓。

2.4经济指标走势图

图2-4经济指标走势图

国内生产总值反映一个国家的经济表现，更可以反映一国的国力与财富。

随着经济的发展，人民对于交通运输的需求也随之增长，因此对公路运输的需求也会增长。

有图可知，GDP及其增长速度在逐年增加，这反映了我的综合国力也在稳步提升。

消费品零售额反映一定时期内人民物质文化生活水平的提高情况，反映社会商品购买力的实现程度。

我国消费品零售总额58年增长了321．9倍，说明市场规模逐渐加大，由此对交通运输业需求增加，从而使公路货运量增加。

由图可以知道社会消费品零售总额也在逐年增加，并且增长速度不断变大。

第三章统计模型与分析

3.1各个因素对公路货运量影响的相关性分析

3.1.2模型原理

所谓相关就是指事物、现象之间的相互关系。

在事物、现象之间，往往存在着一定的关系，一事物的变化，常引起另一事物也发生变化，或者许多事物因受某种因素的影响，同时都在变化。

比如教育事业的发展与科学技术的发展存在着一定的关系；人的身高与体重存在着一定的关系；学生的数学成绩与物理成绩存在着一定的关系等等。

统计学中的相关就是要从数量方面来研究两种或两种以上变量之间的关系。

3.1.2SPSS操作步骤

①按分析——相关——双变量打开双变量相关对话框

②在左侧源变量框中进行如下操作然后点击“确定”按钮，如图所示

3.1.3输出结果及分析

描述性统计量

均值

标准差

公路货运量

1551778.500

472603.8656

公路里程

291.2860

98.85369

载货汽车

1041.210

262.5116

总人口数

130999.500

2172.7875

GDP

224890.130

101219.5490

社会消费品零售总额

84878.490

38809.0406

相关性

公路货运量

公路里程

载货汽车

总人口数

GDP

社会消费品零售总额

公路货运量

Pearson相关性

.856**

.983**

.947**

.993**

1.000**

显著性（双侧）

.002

.000

公路里程

Pearson相关性

.856**

.809**

.938**

.897**

.867**

显著性（双侧）

.002

.005

.000

.001

载货汽车

Pearson相关性

.983**

.809**

.914**

.962**

.981**

显著性（双侧）

.000

.005

.000

总人口数

Pearson相关性

.947**

.938**

.914**

.972**

.954**

显著性（双侧）

.000

GDP

Pearson相关性

.993**

.897**

.962**

.972**

.995**

显著性（双侧）

.000

社会消费品零售总额

Pearson相关性

1.000**

.867**

.981**

.954**

.995**

显著性（双侧）

.000

.001

.000

**.在.01水平（双侧）上显著相关。

由上表可以得到公路里程、载货车辆、总人口数、GDP、社会消费品零售总额与公路货运量的p值均小于0.05，拒接显著性假设，说明以上五个因素对公路货运量均有显著影响。

3.2对影响因素以及货运量预测的线性回归

3.2.1模型原理

回归分析主要的任务是在考察变量直接的数量依存关系的基础上，通过一定的数学表达式将这种关系描述出来，进而确定一个活几个变量（自变量）对另一个变量（因变量）的影响程度。

一元线性回归方程反应一个因变量与一个自变量之间的线性关系，当直线方程的a和b确定时，即为一元回归线性方程。

经过相关分析后，在直角坐标系中将大量数据绘制成散点图，这些点不在一条直线上，但可以从中找到一条合适的直线，使各散点到这条直线的纵向距离之和最小，这条直线就是回归直线，这条直线的方程叫做直线回归方程。

3.2.2SPSS操作步骤

①按分析——回归----线性打开线性回归对话框

②在左侧源变量框中选择GDP作为因变量，将其送入因变量框，选择作年份为自变量，将其送入自变量框，然后点击“确定”按钮，如图所示

图3-1

③在分析完五个因素跟年份的关系后，再用五个因素跟公路货运量进行多元线性回归，得到并分析结果。

3.2.3输出结果及分析

模型汇总

模型

R方

调整R方

标准估计的误差

.980a

.961

.956

21143.6723

a.预测变量:

（常量）,年份。

Anovaa

模型

平方和

均方

Sig.

回归

88632134925.953

198.258

.000b

残差

3576439012.148

447054876.519

总计

92208573938.101

a.因变量:

GDP

b.预测变量:

（常量）,年份。

系数a

模型

非标准化系数

标准系数

Sig.

标准误差

试用版

（常量）

-65509297.073

4668491.321

-14.032

.000

年份

32776.957

2327.842

.980

14.080

.000

a.因变量:

GDP

表3-12011-2017的GDP预测

2011

2012

2013

2014

2015

2016

2017

405163.5

437940.4

470717.4

503494.3

536271.3

569048.2

601825.2

同理，得出公路里程、载货车辆、总人口数与年份的回归方程以及预测分别为：

，其中为年份，为公路里程。

表3-22011-2017的公路里程预测

2011

2012

2013

2014

2015

2016

2017

458.749

489.241

519.733

550.225

580.717

611.209

641.701

，其中为年份，为载货车辆。

表3-32011-2017载货车辆的预测

2011

2012

2013

2014

2015

2016

2017

1483.587

1563.964

1644.341

1724.718

1805.095

1885.472

1965.849

，其中为年份，为总人口数。

表3-42011-2017总人口数预测

2011

2012

2013

2014

2015

2016

2017

134942.3

135659.3

136376.4

137093.4

137810.5

138527.5

139244.6

，其中为社会消费品零售总额，为总人口数。

表3-52011-2017社会消费品零售总额预测

2011

2012

2013

2014

2015

2016

2017

152939.7

165314.6

177689.5

190064.4

202439.3

214814.2

227189.1

然后对五个因素进行多远线性回归，得到如下结果。

输入／移去的变量a

模型

输入的变量

移去的变量

方法

社会消费品零售总额,公路里程,总人口数,载货汽车,GDPb

输入

a.因变量:

公路货运量

b.已输入所有请求的变量。

模型汇总b

模型

R方

调整R方

标准估计的误差

1.000a

1.000

6788.4825

a.预测变量:

（常量）,社会消费品零售总额,公路里程,总人口数,载货汽车,GDP。

b.因变量:

公路货运量

Anovaa

模型

平方和

均方

Sig.

回归

2010005390328.415

402001078065.683

8723.320

.000b

残差

184333976.085

46083494.021

总计

2010189724304.500

a.因变量:

公路货运量

b.预测变量:

（常量）,社会消费品零售总额,公路里程,总人口数,载货汽车,GDP。

系数a

模型

非标准化系数

标准系数

Sig.

B的95.0%置信区间

标准误差

试用版

下限

上限

（常量）

2054512.833

817018.062

2.515

.066

-213892.967

4322918.633

公路里程

-78.303

71.724

-.016

-1.092

.336

-277.440

120.834

载货汽车

12.973

74.924

.007

.173

.871

-195.050

220.997

总人口数

-12.130

6.606

-.056

-1.836

.140

-30.472

6.211

GDP

-.010

.571

-.002

-.017

.987

-1.596

1.576

社会消费品零售总额

12.934

1.669

1.062

7.751

.001

8.301

17.567

a.因变量:

公路货运量

残差统计量a

极小值

极大值

均值

标准偏差

预测值

1058813.000

2443985.250

1551778.500

472582.1963

残差

-7856.0142

5626.3730

.0000

4525.6550

标准预测值

-1.043

1.888

.000

1.000

标准残差

-1.157

.829

.000

.667

a.因变量:

公路货运量

可得出线性回归方程将一元线性回归的结果代入到此方程中，得到下列货运量的预测值：

表3-62011-2017货运量预测值

2011

2012

2013

2014

2015

2016

2017

2375058

2524745

2674431

2824118

2973804

3123491

3273177

3.3用曲线拟合预测货运量

3.3.1模型原理

曲线估计用在因变量与自变量与一个已知或未知的的曲线或者非线性函数关系相联系的情况下，在很多情况下有两个相关的变量，用户希望用其中一个变量对另一个变量进行预测，但是又不能马上根据记录数据确定一种最佳模型，此时可以用曲线估计在众多回归模型中建立一个既简单又比较适合的模型，又根据对世界主要国家小汽车拥有量变化过程的分析可以发现绝大部分国家的小汽车千人拥有量与该国家的人均收入呈S形曲线的变化趋势。

因此选用S型曲线拟合，自变量为城市常住人口人均收入，因变量为机动车总量。

3.3.2SPSS操作步骤

①按分析——回归----曲线估计打开曲线估计对话框

②在左侧源变量框中选择公路货运量作为因变量，将其送入因变量框，选择GDP为自变量，将其送入自变量框，

③然后将模型框中选择多种方法进行拟合，并点击“确定”按钮，如图所示

图3-3

3.3.3输出结果及分析

模型描述

模型名称

MOD_6

因变量

公路货运量

方程

对数

三次

幂a

指数a

自变量

GDP

常数

包含

其值在图中标记为观测值的变量

未指定

用于在方程中输入项的容差

.0001

a.该模型要求所有非缺失值为正数。

个案处理摘要

个案总数

已排除的个案a

已预测的个案

新创建的个案

a.从分析中排除任何变量中带有缺失值的个案。

变量处理摘要

变量

因变量

自变量

公路货运量

GDP

正值数

零的个数

负值数

缺失值数

用户自定义缺失

系统缺失

模型汇总和参数估计值

因变量:

公路货运量

方程

模型汇总

参数估计值

R方

df1

df2

Sig.

常数

对数

.926

99.585

.000

-10619288.242

995132.016

三次

.998

827.611

.000

798750.743

2.022

4.091E-006

2.980E-012

幂

.972

280.182

.000

718.248

.625

指数

.998

3675.040

.000

785122.235

2.856E-006

自变量为GDP。

图3-4

由上图中的可知，三次与指数在此范围内都拟合的较好，但是根据指数的发展趋势可以排除指数拟合，因此选择三次的曲线估计。

根据三次曲线模型可以得到方程：

表3-7对2011-2017的公路货运量的预测

2011

2012

2013

2014

2015

2016

2017

2487761

2719187

2967816

3234276

3519199

3823212

4146947

3.2用时间序列分析预测公路客运量

3.3.1模型原理

从统计意义上讲，时间序列是将一个变量在不同时间上的不同数值按时间先后排列而成的数列。

从数学意义上讲，设Xt（t∈T）是一个随机过程，Xt（i=1，2，……，n）是在Xt在时刻i对过程Xt的观察值，则称Xt为一次样本实现，也就是一个时间序列。

从系统意义上讲，时间序列就是某一系统在不同时间（地点、条件等）的响应。

3.3.2SPSS操作步骤

①按分析——预测----创建模型打开创建模型对话框

②在左侧源变量框中选择公路货运量、载货汽车、公路里程、总人口数、GDP作为因变量，将其送入因变量框，选择年份作为自变量，将其送入自变量框。

在方法一框中选择ARIMA，并设置条件中模型的几个值分别为2、1、1，然后点继续。

接着在统计表选项中选中显示预测值、拟合优度等选项。

③然后将模型框中选择多种方法进行拟合，并点击“确定”按钮，如图所示。

图3-5

图3-6

图3-7

3.3.3输出结果及分析

模型描述

模型类型

模型ID

公路货运量

模型_1

ARIMA（2,1,1）

公路里程

模型_2

ARIMA（2,1,1）

载货汽车

模型_3

ARIMA（2,1,1）

总人口数

模型_4

ARIMA（2,1,1）

GDP

模型_5

ARIMA（2,1,1）

社会消费品零售总额

模型_6

ARIMA（2,1,1）

模型统计量

模型

预测变量数

模型拟合统计量

Ljung-BoxQ（18）

离群值数

平稳的R方

R方

统计量

Sig.

公路货运量-模型_1

.914

.996

公路里程-模型_2

.279

.831

载货汽车-模型_3

.740

.974

总人口数-模型_4

.967

1.000

GDP-模型_5

.906

.997

社会消费品零售总额-模型_6

.940

.998

预测

模型

2011

2012

2013

2014

2015

2016

2017

公路货运量-模型_1

预测

2.7E+006

3.1E+006

3.5E+006

3.9E+006

4.3E+006

4.8E+006

5.3E+006

UCL

2.8E+006

3.2E+006

3.6E+006

4.0E+006

4.5E+006

4.9E+006

5.5E+006

LCL

2.6E+006

3.0E+006

3.4E+006

3.8E+006

4.2E+006

4.7E+006

5.2E+006

公路里程-模型_2

预测

446.14

480.60

502.06

521.48

542.92

564.63

584.90

UCL

584.63

629.87

650.58

669.43

690.68

展开阅读全文