我国国内旅游收入影响因素的多元回归分析Word格式文档下载.docx
《我国国内旅游收入影响因素的多元回归分析Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《我国国内旅游收入影响因素的多元回归分析Word格式文档下载.docx(12页珍藏版)》请在冰点文库上搜索。
5846
640
534.1
70.45
118.58
6.49
1997
2112.7
6420
644
599.8
145.68
122.64
6.6
1998
2391.18
6796
695
607
197
127.85
6.64
1999
2831.92
7159
719
614.8
249.5
135.17
6.74
2000
3175.54
7858
744
678.6
226.6
140.27
6.87
2001
3522.4
8622
784
708.3
212.7
169.8
7.0058
2002
3878.36
9398
878
739.7
209.1
176.52
7.19
2003
3442.27
10542
870
684.9
200
180.98
7.3
2004
4710.7
12336
1102
731.8
210.2
187.07
7.44
2005
5285.9
14053
1212
737.1
227.6
334.52
7.54376
2006
6229.74
16165
1394
766.4
221.9
345.6999
7.70838
2007
7770.6
19524
1610
906.9
222.5
358.3715
7.79659
数据来自《中国统计年鉴2008》
国内旅游收入(亿元):
指国内游客在国内旅行、游览过程中用于交通、参观游览、住宿、餐饮、购物、娱乐等全部花费。
人均收入(元):
指人均国民收入。
公路里程(万公里):
包括大中城市的郊区公路以及通过小城镇街道部分的公路里程和桥梁、渡口的长度,不包括大中城市的街道、厂矿、林区生产用道和农业生产用道的里程。
两条或多条公路共同经由同一路段,只计算一次,不得重复计算里程长度。
本文运用多元回归分析进行数据分析,利用SPSS17.0软件分析得如下结果:
表1
输入/移去的变量b
模型
输入的变量
移去的变量
方法
1
铁路里程(万公里),农村居民人均旅游支出(元),公路里程(万公里),城镇居民人均旅游支出(元),国内旅游人数(百万人次),人均国民收入(元)a
.
输入
2
人均国民收入(元)
向后(准则:
F-to-remove>
=.100的概率)。
3
a.已输入所有请求的变量。
b.因变量:
国内旅游收入(亿元)
由表1知,利用向后筛选策略共经过三步完成回归方程的建立,第一步全部解释变量都进入,第二步中,人均国民收入(元)被剔除,第三步中,公路里程(万公里)被剔除。
表2
模型汇总d
R
R方
调整R方
标准估计的误差
Durbin-Watson
.999a
.998
.996
123.78922
.999b
115.96287
.999c
.997
117.15749
1.251
a.预测变量:
(常量),铁路里程(万公里),农村居民人均旅游支出(元),公路里程(万公里),城镇居民人均旅游支出(元),国内旅游人数(百万人次),人均国民收入(元)。
b.预测变量:
(常量),铁路里程(万公里),农村居民人均旅游支出(元),公路里程(万公里),城镇居民人均旅游支出(元),国内旅游人数(百万人次)。
c.预测变量:
(常量),铁路里程(万公里),农村居民人均旅游支出(元),城镇居民人均旅游支出(元),国内旅游人数(百万人次)。
d.因变量:
由表2知,DW为1.251查表可知不存在自相关。
表3
Anovad
平方和
df
均方
F
Sig.
回归
4.819E7
6
8031771.656
524.138
.000a
残差
107266.403
7
15323.772
总计
4.830E7
13
5
9638063.449
716.724
.000b
107579.096
8
13447.387
4.817E7
4
1.204E7
877.437
.000c
123532.890
9
13725.877
表3中,第三个模型是最终的方程。
选择的显著性水平a是0.05,由于回归方程显著性检验的概率P值小于显著性水平a,因此被解释变量与解释变量之间的线性关系显著,建立线性模型是恰当的。
表4
系数a
非标准化系数
标准系数
t
B
标准误差
试用版
(常量)
-309.896
1635.702
-.189
.855
.016
.111
.037
.143
.890
4.137
1.248
.691
3.314
.013
城镇居民人均旅游支出(元)
5.084
1.154
.340
4.404
.003
农村居民人均旅游支出(元)
2.726
1.070
.095
2.547
.038
1.401
1.473
.065
.952
.373
-585.948
280.062
-.172
-2.092
.075
-463.436
1155.023
-.401
.699
4.298
.503
.718
8.550
.000
5.144
1.005
.344
5.119
.001
2.703
.991
.026
1.454
1.335
.068
1.089
.308
-569.282
238.508
-.167
-2.387
.044
-602.237
1159.797
-.519
.616
4.748
.290
.793
16.366
4.745
.945
.317
5.019
2.886
.987
.101
2.925
.017
-534.685
238.819
-.157
-2.239
.052
a.因变量:
由表4知,如果选择的显著性水平a为0.05,前两个模型中由于都存在回归系数不显著的解释变量,因此这些方程都不可用。
第三个方程是最终的方程,其回归系数显著性检验的概率P值小于显著性水平a,因此这四个解释变量保存在模型中是合理的。
最终的回归方程为:
国内旅游收入=-602.237+4.748国内旅游人数+4.745城镇人均旅游支出+2.886农r村人均旅游支出-534.685铁路里程
表5
已排除的变量c
BetaIn
偏相关
共线性统计量
容差
.037a
.054
.005
.099b
.397
.702
.139
.068b
.359
.072
a.模型中的预测变量:
b.模型中的预测变量:
c.因变量:
表5给出了变量剔除方程的过程。
在模型二中,人均国民收入保留的情况下,它的标准化回归系数为0.037,回归系数的检验不显著(概率P值为0.890)。
在模型三中,在剔除公路里程的情况下,保留的人均国民收入,它的标准化回归系数为0.099,回归系数的检验不显著(概率P值为0.702)。
在剔除人均国民收入的情况下,保留的公路里程,它的标准化回归系数为0.068,回归系数的检验不显著(概率P值为0.308)。
表6
残差统计量a
极小值
极大值
均值
标准偏差
N
预测值
857.2092
7818.9868
3527.7786
1925.02474
14
-205.14450
173.07202
.00000
97.48092
标准预测值
-1.387
2.229
1.000
标准残差
-1.751
1.477
.832
表6中,数据点围绕基准线还存在一定的规律性,但标准化残差的非参数检验结果显示标准化残差与标准正态分布不存在显著差异,可以认为残差满足了线性模型的前提要求。
表7
表7中,随着标准化预测值的变化,残差点在0点周围随机分布,因此认为异方差并不明显。
参考资料:
1.《统计分析方法与SPSS的应用》,薛薇编
2.《应用回归分析》,何晓群、刘文卿编
3.《中国统计年鉴2008》
心得体会:
这份实习报告是我一字一字打上去,所涉及数据均是一项一项从中国统计年鉴查找,导入Excel,而后导入SPSS进行处理分析。
这份报告是对这两个星期的总结,而这次实习使我对SPSS统计软件的应用、应用回归分析和多元回归分析有更加深刻的了解和理解。
这次实习还教会了我如何从中国统计年鉴以及相关年鉴中找到自己需要的数据,这让我受益匪浅。