spss课程设计.docx

上传人:b****1 文档编号:13664678 上传时间:2023-06-16 格式:DOCX 页数:30 大小:594.84KB
下载 相关 举报
spss课程设计.docx_第1页
第1页 / 共30页
spss课程设计.docx_第2页
第2页 / 共30页
spss课程设计.docx_第3页
第3页 / 共30页
spss课程设计.docx_第4页
第4页 / 共30页
spss课程设计.docx_第5页
第5页 / 共30页
spss课程设计.docx_第6页
第6页 / 共30页
spss课程设计.docx_第7页
第7页 / 共30页
spss课程设计.docx_第8页
第8页 / 共30页
spss课程设计.docx_第9页
第9页 / 共30页
spss课程设计.docx_第10页
第10页 / 共30页
spss课程设计.docx_第11页
第11页 / 共30页
spss课程设计.docx_第12页
第12页 / 共30页
spss课程设计.docx_第13页
第13页 / 共30页
spss课程设计.docx_第14页
第14页 / 共30页
spss课程设计.docx_第15页
第15页 / 共30页
spss课程设计.docx_第16页
第16页 / 共30页
spss课程设计.docx_第17页
第17页 / 共30页
spss课程设计.docx_第18页
第18页 / 共30页
spss课程设计.docx_第19页
第19页 / 共30页
spss课程设计.docx_第20页
第20页 / 共30页
亲,该文档总共30页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

spss课程设计.docx

《spss课程设计.docx》由会员分享,可在线阅读,更多相关《spss课程设计.docx(30页珍藏版)》请在冰点文库上搜索。

spss课程设计.docx

spss课程设计

spss课程设计

 

课程设计

 

设计题目:

上海公路客运量需求预测与分析

课程名称:

运输统计与分析

学院:

交通运输工程学院

专业:

交通运输

班级:

学生姓名:

学号:

指导教师:

====2011/2012学年第二学期====

一、

二、

三、成绩评定

平时考勤20%,报告撰写规范20%,内容(选题合理、方案可行、分析正确、有创新)60%。

成绩评定实行优秀、良好、中等、及格和不及格五个等级。

优秀者人数一般不得超过总人数的20%。

四、报告格式

课程设计报告装订顺序依次为:

封面、课程设计(学年论文)任务书、目录、正文、参考文献、成绩评定表。

报告中所有图表应按“章号-图表序号-图表名”(例:

图1-1-***频数图)进行编号。

具体格式参看实验报告样本。

五、主要参考资料

1.罗应婷等主编.SPSS统计分析从基础到实践.北京:

电子工业出版社,2007年6月;

2.章文波陈红艳编著.《实用数据统计分析及SPSS12.0应用》.人民出版社,2006年;

3.张文彤.SPSS.11.0统计分析教程.(高级篇).北京希望电子出版社.2002年6月;

4.郝黎仁等.SPSS实用统计分析.中国水利水电出版社.2003年1月。

 

1概述

1.1研究背景

随着社会经济的发展,人民生活水平日渐提高,公路基础设施建设取得了跨越式发展,公路客运日益增加。

对于经济相当发达的上海市,公路交通是其居民出行的重要交通方式。

改革开放以来,特别是进入“八五”以来,随着我国公路状况的不断改善,公路客运以其快速、灵活、方便的优势快速发展。

据统计,“八五”期间全国客运量比“七五”增长51.8%,年均递增9.8%,同期公路客运年均递增率达11.1%。

自1991年以来,在全国新增旅客运量中,公路客运量占99%。

公路客运除在运量上大大高于铁路等其他运输方式外,自1995年起,其旅客周转量占全国旅客周转量的比重也已超过50%。

导致公路客运量持续增长的主要原因:

一是公路对铁路继续保持在中、短途客运上的分流优势;二是公路客运因高速公路和其他高等级公路的发展而在中、长途客运上逐步获得了市场竞争优势;三是场站及车辆等服务设施和装备水平不断提高;四是公路客运的整体服务质量与水平在逐步改善,使公路客运对旅客的吸引力在提高。

研究公路交通客运的需求有重大意义。

一个高效运行的客运系统有利于交通的通畅,方便人们出行,减少环境污染。

分析公路客运量的发展变化规律,研究公路客运量的预测技术,并应用于公路客运管理工作中,对提高公路交通的管理水平和公路营运效率具有非常重要的实际意义,从而促进公路交通事业的持续发展,缓解交通压力。

预测未来若干年后上海市公路客运量及其发展趋势,可以为投资、规划、优化配置资源及其相关问题的科学决策提供可靠依据,同时提高公路客运的经济效益和社会效益,也对公路管理水平和建立高效公路客运交通系统具有重要作用。

在预先掌握公路线路客运量发展变化的情况下,公路客运企业才能科学的制定调度计划,合理地调配人、车资源。

从而改变以往车辆管理调度中缺乏实用的分析预测手段,大多依靠经验和直觉来判断客运量变化的传统方式。

因此,上海市公路客运量预测为上海市的公共交通规划提供有力的支持。

1.2常用分析方法

研究公路客运量需求预测这类问题涉及到统计学、运筹学、交通经济学等学科,常用的预测方法有回归分析法、灰色模型、组合预测法。

1.2.1回归分析法:

回归分析法是指根据预测的相关性原则,找出影响预测目标的各因素,并用数学方法找出这些因素与预测目标之间的函数关系的近似表达,再利用样本数据对其模型估计参数及对模型进行误差检验,一旦模型确定,就可利用模型,根据因素的变化值进行预测。

回归分析预测法的步骤:

a.根据预测目标,确定自变量和因变量;

b.建立回归预测模型;

c.进行相关分析;

d.检验回归预测模型,计算预测误差;

c.计算并确定预测值。

1.2.2灰色模型预测:

灰色预测模型是通过少量的、不完全的信息,建立数学模型并做出预测的一种预测方法。

灰色系统的特点:

a.用灰色数学处理不确定量,使之量化;

b.充分利用已知信息寻求系统的运动规律;

c.灰色系统理论能处理贫信息系统.

1.2.3组合预测:

组合预测方法是对同一个问题,采用两种以上不同预测方法的预测。

它既可是几种定量方法的组合,也可是几种定性的方法的组合,但实践中更多的则是利用定性方法与定量方法的组合。

组合的主要目的是综合利用各种方法所提供的信息,尽可能地提高预测精度。

1.2.4时间序列法:

时间序列回归模型,是考虑事物发展的变化规律,以时间为自变量建立的一种相关模型,它既考虑了事物发展的延续性,又充分考虑到事物的发展受偶然因素的作用而产生的随机变化。

1.2.5多元回归方法:

多元回归分析预测法是通过对两个或两个以上的自变量与一个因变量的相关分析,建立预测模型进行预测的方法。

它是研究一个随机变量与两个或两个以上一般变量之间相依关系的统计分析方法。

1.3本设计采用的分析方法

本课程设计将采用一元线性回归预测法、多元回归预测方法,时间序列法,S曲线分析进行分析与预测。

 

2

数据采集

2.1数据来源

本设计所需的数据,(总人口、生产总值、旅客周转率等经济指标的)来源是2011年中国统计年鉴(

表2-1:

上海市2006-2010年统计年鉴

年度

公路客运量

(万人)

总人口(万人)

生产总值

(亿元)

旅客周转量

(亿人公里)

2006

2784

1815

10572.24

86.8

2007

2872

1858

12494.01

94.0

2008

2934

1888

14069.86

94.1

2009

2995

1921

15046.45

99.6

2010

3634

2302

17165.98

115.4

2.2数据处理

本课程设计选取上海市总人口数量、生产总值、旅客周转量作为主要指标。

a.总人口数量。

针对此模型中被解释变量为公路客运量,其主要消费者为上海市民,总人口数量是一个重要的影响因素。

b.生产总值。

交通运输的发展离不开国家宏观经济的密切影响,因此选取地区生产总值(GDP)作为解释变量之一,分析其对公路客运量的影响。

c.旅客周转量。

反映交通部门一定时期内旅客运输工作量的指标。

指旅客人数与运送距离的乘积,旅客周转量是制订运输计划和考核运输任务完成情况的主要依据之一。

因此旅客周转量也是一个重要的影响因素。

2.2.1数据描述性分析

处理过程:

打开spss软件,在菜单栏中找到“分析—描述统计—频率”,单击出现一个对话框,在对话框中输入变量和数据,点击确定,即可得到最终数据。

表2—1:

各指标描述性统计表

描述统计量

N

极小值

极大值

均值

标准差

公路客运量(万人)

5

2784

3634

3043.80

339.037

总人口(万人)

5

1815

2302

1956.80

196.880

生产总值(亿元)

5

10572.24

17165.98

13869.7080

2502.80002

旅客周转量(亿人公里)

5

86.8

115.4

97.980

10.7467

有效的N(列表状态)

5

图2—1:

公路客运量与总人口茎叶图

 

 

图2—2:

公路客运量与生产总值茎叶图

图2—3:

公路客运量与旅客周转量茎叶图

表2—3:

各指标相互相关性

相关性

公路客运量(万人)

总人口(万人)

生产总值(亿元)

旅客周转量(亿人公里)

公路客运量(万人)

Pearson相关性

1

.999**

.872

.975**

显著性(双侧)

.000

.054

.005

N

5

5

5

5

总人口(万人)

Pearson相关性

.999**

1

.855

.969**

显著性(双侧)

.000

.065

.007

N

5

5

5

5

生产总值(亿元)

Pearson相关性

.872

.855

1

.938*

显著性(双侧)

.054

.065

.018

N

5

5

5

5

旅客周转量(亿人公里)

Pearson相关性

.975**

.969**

.938*

1

显著性(双侧)

.005

.007

.018

N

5

5

5

5

**.在.01水平(双侧)上显著相关。

*.在0.05水平(双侧)上显著相关。

2.3现状分析

经过对以上图表的数据分析可以得出:

①根据公路客运量与其他各指标的茎叶图,可以看出公路客运量的数量随着各指标的增长而增长,呈正相关关系。

②根据各指标相互相关性表,可以看出公路客运量与总人口、旅客周转量的pearson相关性较强;总人口与公路客运量、旅客周转量的pearson相关性较强;生产总值与旅客周转量的pearson相关性较强;旅客周转量与总人口、公路客运量和生产总值的pearson相关性较强。

③根据各指标相互相关性表,可以看出公路客运量与总人口、旅客周转量显著相关;总人口与公路客运量显著相关;生产总值与各指标不显著相关;旅客周

转量与共路客运量显著相关。

 

3统计模型与分析

3.1一元线性回归预测

3.1.1一元线性回归预测原理

一元线性回归预测法是分析一个因变量与一个自变量之间的线性关系的预测方法。

设y为因变量,

为自变量,并且自变量与因变量之间为线性关系时,则一元线性回归预测的基本思想:

确定直线的方法是最小二乘法。

最小二乘法的基本思想:

最有代表性的直线应该是直线到各点的距离最近。

然后用这条直线进行预测。

3.1.2操作步骤及结果分析

影响上海市公路客运量的3个因素:

总人口,生产总值,旅客周转量。

以年度为自变量,各因素为因变量建立模型预测结果如下。

(1)以年度为自变量,总人口为因变量建立预测模型

A.SPSS操作步骤如下:

①按分析—回归—线性,打开对话框;

②将自变量输入年度,因变量输入总人口,单击确定。

如图所示。

图3-1-1:

spss操作步骤截图

B.输出结果:

表3-1-1:

总人口为因变量时的输出结果

输入/移去的变量a

模型

输入的变量

移去的变量

方法

1

年度b

.

输入

a.因变量:

总人口(万人)

b.已输入所有请求的变量。

模型汇总

模型

R

R方

调整R方

标准估计的误差

更改统计量

R方更改

F更改

df1

df2

Sig.F更改

1

.833a

.694

.591

125.844

.694

6.790

1

3

.080

a.预测变量:

(常量),年度。

系数a

模型

非标准化系数

标准系数

t

Sig.

B的95.0%置信区间

B

标准误差

试用版

下限

上限

1

(常量)

-206272.800

79908.917

-2.581

.082

-460578.639

48033.039

年度

103.700

39.795

.833

2.606

.080

-22.946

230.346

a.因变量:

总人口(万人)

C.结果分析:

①依据上述表格得到模型的拟合优度R^2=0.694,说明拟合程度较好;

②得到回归方程:

Y=-206272.800+103.700X1.(Y:

总人口,X1:

年度)

表3-1-1:

2011—2015年上海总人口的预测结果(单位:

万人)

年份

2011

2012

2013

2014

2015

预测量

2267.9

2371.6

2475.3

2579

2682.7

(2)以年度为自变量,生产总值为因变量建立预测模型

A.SPSS操作步骤:

如上所述(略)

B.输出结果:

表3-1-2:

生产总值为因变量时的输出结果

输入/移去的变量a

模型

输入的变量

移去的变量

方法

1

年度b

.

输入

a.因变量:

生产总值(亿元)

b.已输入所有请求的变量。

模型汇总

模型

R

R方

调整R方

标准估计的误差

更改统计量

R方更改

F更改

df1

df2

Sig.F更改

1

.994a

.989

.985

306.33516

.989

264.005

1

3

.001

a.预测变量:

(常量),年度。

Anovaa

模型

平方和

df

均方

F

Sig.

1

回归

24774508.161

1

24774508.161

264.005

.001b

残差

281523.693

3

93841.231

总计

25056031.854

4

a.因变量:

生产总值(亿元)

b.预测变量:

(常量),年度。

系数a

模型

非标准化系数

标准系数

t

Sig.

B的95.0%置信区间

B

标准误差

试用版

下限

上限

1

(常量)

-3146706.228

194518.389

-16.177

.001

-3765750.557

-2527661.899

年度

1573.992

96.872

.994

16.248

.001

1265.703

1882.281

a.因变量:

生产总值(亿元)

C.结果分析:

①依据上述表格得到模型的拟合优度R^2=0.989,所以拟合程度很好;

②得到回归方程:

Y=-3146706.228+1573.992X1。

(Y:

生产总值,X1:

年度)

表3-1-3上海2011-2015年生产总值预测结果(单位:

亿元)

年份

2011

2012

2013

2014

2015

预测量

18591.68

20165.68

21739.67

23313.66

24887.65

(3)以年度为自变量,旅客周转量为因变量建立预测模型

A.SPSS操作步骤:

如上所述(略)

B.输出结果:

表3-1-4:

旅客周转量为因变量时的输出结果

输入/移去的变量a

模型

输入的变量

移去的变量

方法

1

年度b

.

输入

a.因变量:

旅客周转量(亿人公里)

b.已输入所有请求的变量。

模型汇总

模型

R

R方

调整R方

标准估计的误差

更改统计量

R方更改

F更改

df1

df2

Sig.F更改

1

.924a

.854

.805

4.7464

.854

17.506

1

3

.025

a.预测变量:

(常量),年度。

Anovaa

模型

平方和

df

均方

F

Sig.

1

回归

394.384

1

394.384

17.506

.025b

残差

67.584

3

22.528

总计

461.968

4

a.因变量:

旅客周转量(亿人公里)

b.预测变量:

(常量),年度。

系数a

模型

非标准化系数

标准系数

t

Sig.

B的95.0%置信区间

B

标准误差

试用版

下限

上限

1

(常量)

-12512.260

3013.874

-4.152

.025

-22103.753

-2920.767

年度

6.280

1.501

.924

4.184

.025

1.503

11.057

a.因变量:

旅客周转量(亿人公里)

C.结果分析:

①依据上述表格得到模型的拟合优度R^2=0.854,所以拟合程度很好;

②得到回归方程Y=-12512.260+6.280X1。

(Y:

旅客周转量,X1:

年度)

表3-1-5:

上海2011-2015年旅客周转量预测结果(单位:

亿人公里)

年份

2011

2012

2013

2014

2015

预测量

116.82

123.1

129.38

135.66

141.94

3.2多元线性回归预测

3.2.1多元线性回归预测原理

多元回归分析是研究多个变量之间关系的回归分析方法,按因变量和自变量的数量对应关系可划分为一个因变量对多个自变量的回归分析(简称为“一对多”回归分析)及多个因变量对多个自变量的回归分析(简称为“多对多”回归分析),按回归模型类型可划分为线性回归分析和非线性回归分析。

利用二元线性回归方程,以旅客周转量,GDP,总人口为自变量,公路客运量为因变量,建立模型预测分析,结果如下:

3.2.2SPSS操作步骤:

①按分析—回归—线性,打开对话框;

②将自变量输入总人口、生产总值、旅客周转量,因变量输入公路客运量,单击确定。

如图所示。

图3-2-1:

spss操作步骤截图

3.2.3输出结果分析

表3-2-1:

多元线性回归输出结果

输入/移去的变量a

模型

输入的变量

移去的变量

方法

1

旅客周转量(亿人公里),生产总值(亿元),总人口(万人)b

.

输入

a.因变量:

公路客运量(万人)

b.已输入所有请求的变量。

模型汇总

模型

R

R方

调整R方

标准估计的误差

更改统计量

R方更改

F更改

df1

df2

Sig.F更改

1

1.000a

1.000

1.000

1.308

1.000

89625.769

3

1

.002

a.预测变量:

(常量),旅客周转量(亿人公里),生产总值(亿元),总人口(万人)。

Anovaa

模型

平方和

df

均方

F

Sig.

1

回归

459783.090

3

153261.030

89625.769

.002b

残差

1.710

1

1.710

总计

459784.800

4

a.因变量:

公路客运量(万人)

b.预测变量:

(常量),旅客周转量(亿人公里),生产总值(亿元),总人口(万人)。

系数a

模型

非标准化系数

标准系数

t

Sig.

B的95.0%置信区间

B

标准误差

试用版

下限

上限

1

(常量)

-260.559

8.281

-31.466

.020

-365.774

-155.344

总人口(万人)

1.625

.017

.944

94.443

.007

1.406

1.844

生产总值(亿元)

.009

.001

.063

8.858

.072

-.004

.021

旅客周转量(亿人公里)

.066

.471

.002

.140

.912

-5.913

6.044

a.因变量:

公路客运量(万人)

可得回归方程Y=1.625X1+0.009X2+0.066X3-260.559。

(Y:

公路客运量,X1:

总人口,X2:

生产总值,X3:

旅客周转量。

)将2011-2015年上海总人口,生产总值,旅客周转量预测值代入方程得到2011-2015年上海公路客运量结果如下:

表3-2-2:

2011-2015年上海公路客运量(单位:

万人)

年份

2011

2012

2013

2014

2015

预测量

3599.814

3782.907

3966

4149.093

4332.185

3.3时间序列法:

3.3.1时间序列原理

时间序列是指将某种现象某一个统计指标在不同时间上的各个数值,按时间先后顺序排列而形成的序列。

时间序列法是一种定量预测方法,亦称简单外延方法。

在统计学中作为一种常用的预测手段被广泛应用。

3.3.2SPSS操作步骤

①按分析—回归—线性,打开对话框;

②将自变量输入年度,因变量输入公路客运量,单击确定。

如图所示。

图3-3-1:

spss操作步骤截图

3.3.3输出结果分析

表3-3-1:

时间序列法输出结果

输入/移去的变量a

模型

输入的变量

移去的变量

方法

1

年度b

.

输入

a.因变量:

公路客运量(万人)

b.已输入所有请求的变量。

模型汇总

模型

R

R方

调整R方

标准估计的误差

更改统计量

R方更改

F更改

df1

df2

Sig.F更改

1

.850a

.723

.630

206.116

.723

7.823

1

3

.068

a.预测变量:

(常量),年度。

Anovaa

模型

平方和

df

均方

F

Sig.

1

回归

332332.900

1

332332.900

7.823

.068b

残差

127451.900

3

42483.967

总计

459784.800

4

a.因变量:

公路客运量(万人)

b.预测变量:

(常量),年度。

系数a

模型

非标准化系数

标准系数

t

Sig.

B的95.0%置信区间

B

标准误差

试用版

下限

上限

1

(常量)

-363014.600

130880.922

-2.774

.069

-779536.107

53506.907

年度

182.300

65.180

.850

2.797

.068

-25.131

389.731

a.因变量:

公路客运量(万人)

可得回归方程:

Y=-363014.600+182.300X1。

(Y:

公路客运量,X1:

年度)

表3-3-2:

2011-2015年上海公路客运量预测结果(单位:

万人)

年份

2011

2012

2013

2014

2015

预测量

3590.7

3773

3955.3

4137.6

4319.9

3.4曲线拟合

3.4.1曲线拟合原理

曲线拟合(curvefitting)是指在因变量与自变量与一个已知或未知的的曲线或者非线性函数关系相联系的情况下,在很多情况下有两个相关的变量,用户希望用其中一个变量对另一个变量进行预测,但是又不能马上根据记

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 自然科学 > 物理

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2