级研究生《应用统计学》作业解答.docx
《级研究生《应用统计学》作业解答.docx》由会员分享,可在线阅读,更多相关《级研究生《应用统计学》作业解答.docx(24页珍藏版)》请在冰点文库上搜索。
![级研究生《应用统计学》作业解答.docx](https://file1.bingdoc.com/fileroot1/2023-5/3/5c4d0d37-5ea9-4547-affb-7994bad90f0b/5c4d0d37-5ea9-4547-affb-7994bad90f0b1.gif)
级研究生《应用统计学》作业解答
2010级研究生《应用统计学》作业
作业1:
多元线性回归
P138—例5.3题:
中国民航客运的回归模型。
为了研究我国民航客运量的变化趋势及其成因,我们以民航客运量作为因变量Y,以国民收入、消费额、铁路客运量、民航航线里程、来华旅游入境人数为影响民航客运量的主要因素。
Y为民航客运量(万人),x1为国民收入(亿元)、x2为消费额(亿元)、x3为铁路客运量(万人)、x4为民航航线里程(万公里)、x5为来华旅游入境人数(万人)。
根据《1994年统计摘要》获得1978-1993年统计数据,见表1。
表1
年份
y
x1
x2
x3
x4
x5
1978
231.0
3010.0
1888.0
81491.0
14.89
180.92
1979
298.0
3350.0
2195.0
86389.0
16.0
420.39
1980
343.0
3688.0
2531.0
92204.0
19.53
570.25
1981
401.0
3941.0
2799.0
95300.0
21.82
776.71
1982
445.0
4258.0
3054.0
99922.0
23.27
792.43
1983
391.0
4736.0
3358.0
106044.0
22.91
947.7
1984
554.0
5652.0
3905.0
110353.0
26.02
1285.22
1985
744.0
7020.0
4879.0
112110.0
27.72
1783.3
1986
997.0
7859.0
5552.0
108579.0
32.43
2281.95
1987
1310.0
9313.0
6386.0
112429.0
38.91
2690.23
1988
1442.0
11738.0
8038.0
122645.0
37.38
3169.48
1989
1283.0
13176.0
9005.0
113807.0
47.19
2450.14
1990
1660.0
14384.0
9663.0
95712.0
50.68
2746.2
1991
2178.0
16557.0
10969.0
95081.0
55.91
3335.65
1992
2886.0
20223.0
12985.0
99693.0
83.66
3311.5
1993
3383.0
24882.0
15949.0
105458.0
96.08
4152.7
第一步:
做相关分析,设定理论模型。
用SPSS软件计算增广相关阵,自变量的偏相关阵,输出结果见表2。
表2
Correlations
y
x1
x2
x3
x4
x5
y
PearsonCorrelation
1
.989**
.985**
.227
.987**
.924**
Sig.(2-tailed)
.000
.000
.398
.000
.000
N
16
16
16
16
16
16
x1
PearsonCorrelation
.989**
1
.999**
.258
.984**
.930**
Sig.(2-tailed)
.000
.000
.335
.000
.000
N
16
16
16
16
16
16
x2
PearsonCorrelation
.985**
.999**
1
.289
.978**
.942**
Sig.(2-tailed)
.000
.000
.278
.000
.000
N
16
16
16
16
16
16
x3
PearsonCorrelation
.227
.258
.289
1
.213
.504*
Sig.(2-tailed)
.398
.335
.278
.428
.046
N
16
16
16
16
16
16
x4
PearsonCorrelation
.987**
.984**
.978**
.213
1
.882**
Sig.(2-tailed)
.000
.000
.000
.428
.000
N
16
16
16
16
16
16
x5
PearsonCorrelation
.924**
.930**
.942**
.504*
.882**
1
Sig.(2-tailed)
.000
.000
.000
.046
.000
N
16
16
16
16
16
16
**.Correlationissignificantatthe0.01level(2-tailed).
*.Correlationissignificantatthe0.05level(2-tailed).
从相关阵看出,Y与x1、x2、x4、x5的相关系数都在0.9以上,说明所选自变量是与y高度线性相关的,用Y与自变量做多元线性回归是适合的。
Y与x3的相关系数ry3=0.227偏小,p值=0.199,x3是铁路客运量,这说明铁路客运量对民航客运量无显著影响。
但是仅凭简单的相关系数的大小是不能决定变量的取舍的,在初步建模时还是应该包括x3在内的。
第二步:
回归分析。
第三步:
回归诊断。
回归方程:
复相关系数R=0.999,决定系数R2=0.998,由决定系数看回归方程高度显著。
方差分析表,F=1121.144,P=0.000,表明回归方程高度显著,x1、x2、x3、x4、x5整体上对y有高度显著的线性影响。
回归系数的显著性检验。
自变量x1、x2、x3、x4、x5对y均有显著影响,其中,x3铁路客运量的P值=0.006最大,但仍在1%的显著性水平上对Y高度显著,这说明在多元线性回归中不能仅凭简单相关系数的大小决定变量的取舍。
作业2:
主成分分析
P335—例12.1题:
在企业经济效益的评价中,设计的指标往往很多。
为了简化系统结构,抓住经济效益评价中的主要问题,我们可由原始数据矩阵出发求主成分。
在我国部分省、市、自治区独立核算的工业企业的经济效益评价中,涉及9项指标,原始数据见表3.即样品数据n=28,变量数p=9。
表3
地区
百万固定资产原值实现值
(%)
百元固定资产原值实现利税
(%)
百元资金实现利税
(%)
百元工业总产值实现利税
(%)
百元销售收入实现
利税
(%)
每吨标准煤实现工业产值
(元)
每千瓦时电力实现工业产值
(元)
全员劳动生产率(元/人.
年)
百元流动资金实现产值(元)
北京
(1)
119.29
30.98
29.92
25.97
15.48
2178
3.41
21006
296.7
天津
(2)
143.98
31.59
30.21
21.94
12.29
2852
4.29
20254
363.1
河北(3)
94.8
17.2
17.95
18.14
9.37
1167
2.03
12607
322.2
山西(4)
65.8
11.08
11.06
12.15
16.84
8.82
1.65
10166
284.7
内蒙(5)
54.79
9.24
9.54
16.86
6.27
894
1.8
7564
225.4
辽宁(6)
94.51
21.12
22.83
22.35
11.28
1416
2.36
13.386
311.7
吉林(7)
80.49
13.36
13.76
16.6
7.14
1306
2.07
9400
274.1
黑龙江(8)
75.86
15.82
16.67
20.86
10.37
1267
2.26
9830
267
上海(9)
187.79
45.9
39.77
24.44
15.09
4346
4.11
31246
418.6
江苏(10)
205.96
27.65
22.58
13.42
7.81
3202
4.69
23377
407.2
浙江(11)
207.46
33.06
25.78
15.94
9.28
3811
4.19
22054
385.5
安徽(12)
110.78
20.7
20.12
18.69
6.6
1468
2.23
12578
341.1
福建(13)
122.76
22.52
19.93
18.34
8.35
2200
2.63
12164
301.2
江西(14)
94.94
14.7
14.18
15.49
6.69
1669
2.24
10463
274.4
山东(15)
117.58
21.93
20.89
18.65
9.1
1820
2.8
17829
331.1
河南(16)
85.98
17.3
17.18
20.12
7.67
1306
1.89
11247
276.5
湖北(17)
103.96
19.5
18.48
18.77
9.16
1829
2.75
15745
308.9
湖南(18)
104.03
21.47
21.28
20.63
8.72
1272
1.98
13161
309
广东(19)
136.44
23.64
20.83
17.33
7.85
2959
3.71
16259
334
广西(20)
100.72
22.04
20.9
21.88
9.67
1732
2.13
12441
296.4
四川(21)
84.73
14.35
14.17
16.93
7.96
1310
2.34
11703
242.5
贵州(22)
59.05
14.48
14.35
24.53
8.09
1068
1.32
9710
206.7
云南(23)
73.72
21.91
22.7
29.72
9.38
1447
1.94
12517
295.8
陕西(24)
78.02
13.13
12.57
16.83
9.19
1731
2.08
11369
220.3
甘肃(25)
59.62
14.07
16.24
23.59
11.34
926
1.13
13084
246.8
青海(26)
51.66
8.32
8.26
16.11
7.05
1055
1.31
9246
176.49
宁夏(27)
52.95
8.25
8.82
15.57
6.58
834
1.12
10406
245.4
新疆(28)
60.29
11.26
13.14
18.68
8.39
1041
2.9
10983
266
1、标准化原始数据。
得到数据表4:
表4
0.423523
1.338405
1.590282
1.687556
2.239634
0.481971
0.954746
1.260371
0.048805
0.995199
1.409649
1.631453
0.667228
1.065873
1.188758
1.855394
1.133844
1.200166
-0.143523
-0.271001
-0.109061
-0.294868
-0.008542
-0.578208
-0.457635
-0.152788
0.490970
-0.814993
-0.985774
-1.087213
-1.811435
2.740046
-1.792728
-0.846551
-0.563494
-0.159272
-1.069921
-1.200673
-1.303002
-0.618942
-1.149187
-0.864488
-0.693032
-1.001289
-1.187521
-0.150237
0.186827
0.583737
0.771033
0.694243
-0.317096
-0.119892
-2.271705
0.308902
-0.474859
-0.719486
-0.703902
-0.684770
-0.829071
-0.432447
-0.416696
-0.692376
-0.343074
-0.582063
-0.432176
-0.290779
0.393790
0.359408
-0.473344
-0.222238
-0.620028
-0.466186
2.009583
3.080956
2.988656
1.300186
2.096133
2.755433
1.671171
2.983284
2.162524
2.430294
0.949485
0.548246
-1.489892
-0.582544
1.555783
2.264780
1.659299
1.964851
2.465025
1.581335
1.002539
-0.851871
-0.041657
2.194408
1.753048
1.436700
1.588578
0.226481
0.137774
0.199007
-0.155617
-1.027764
-0.262566
-0.252942
-0.157668
0.818691
0.503868
0.350337
0.172033
-0.244231
-0.383851
0.505041
0.156444
-0.227324
0.126834
-0.140281
-0.562984
-0.644276
-0.965803
-0.994648
-0.051789
-0.242707
-0.513523
-0.337872
0.383929
0.281429
0.308322
-0.165745
-0.107888
0.106557
0.330433
0.725830
0.645294
-0.347742
-0.259322
-0.218375
0.206435
-0.634057
-0.432447
-0.600920
-0.381613
-0.301458
0.068569
-0.002378
-0.033819
-0.135363
-0.085811
0.115994
0.279260
0.375190
0.260351
0.070190
0.227705
0.363689
0.335558
-0.247709
-0.468101
-0.508808
-0.059576
0.262085
0.820617
0.481145
0.299804
-0.499946
-0.567826
1.300963
1.261785
0.461673
0.695579
-0.006450
0.294277
0.309741
0.652037
0.101843
0.014276
-0.355288
-0.180718
0.043603
-0.376685
-0.603861
-0.645696
-0.601220
-0.527351
-0.428252
-0.140361
-0.304889
-0.891011
-0.971284
-0.588678
-0.620142
1.322972
-0.479518
-0.682024
-1.184294
-0.640218
-1.511775
-0.631612
0.279093
0.565282
2.636993
-0.004862
-0.284588
-0.549747
-0.167931
0.033199
-0.532050
-0.746349
-0.872843
-0.626538
-0.074773
0.013227
-0.406462
-0.361086
-1.275954
-0.958086
-0.636563
-0.351824
1.084980
0.716320
-0.830932
-1.378753
-0.072531
-0.816450
-1.142393
-1.308123
-1.484720
-0.808830
-0.862186
-0.695657
-1.194529
-0.718287
-2.035609
-1.112524
-1.316298
-1.405218
-0.945549
-1.035123
-0.927407
-1.388987
-0.523114
-0.840725
-0.942573
-0.964751
-0.791922
-0.158149
-0.369133
-0.710338
0.432779
-0.426032
-0.483526
2、将标准化数据进行主成分分析。
由TotalVarianceExplained表我们可以看到前面两个主成分y1,y2的方差和占全部方差的比例为84.7%。
故选取y1为第一主成分,y2为第二主成分,且这两个主成分之方差和占全部方差的84.7%,即基本上保留了原来指标的信息,这样由原来的9个指标转化为2个新指标,起到了降维的作用。
由该表得到前2个主成分y1,y2的线性组合为:
作业3:
判别分析
P335—例12.1题:
2005年全国城镇居民月平均消费状况可划分为两类,分类后的数据见表3.试建立费歇线性判别函数,并将广东、西藏两个待判省区归类。
x1人均粮食支出,x2人均副食支出,x3人均烟、酒、饮料支出,x4人均其他副食支出,x5人均衣着支出,x6人均日用杂品支出,x7人均水电燃料支出,x8人均其他非商品支出。
表52005年31个省、市、自治区城镇居民月平均消费类型划分数据
序号
地区
x1
x2
x3
x4
x5
x6
x7
x8
Group
1
北京
21.3
124.89
35.43
73.98
93.01
20.58
43.97
433.73
1
2
上海
21.13
168.69
40.81
70.12
74.32
15.46
50.9
422.74
1
3
浙江
19.96
142.24
43.33
50.74
101.77
12.92
53.44
394.55
1
4
天津
21.5
122.39
29.08
51.64
55.04
11.3
54.88
288.13
2
5
河北
18.25
90.21
24.45
32.44
62.48
7.45
47.5
178.84
2
6
山西
21.84
66.38
18.05
61.32
74.48
8.19
34.97
177.45
2
7
内蒙古
21.37
67.08
20.28
35.27
81.07
10.94
39.46
182.2
2
8
辽宁
22.74
115.88
28.21
42.44
58.07
9.63
48.65
194.85
2
9
吉林
20.22
88.94
18.54
35.63
65.72
8.81
50.29
186.52
2
10
黑龙江
21.33
75.5
14
29.56
69.29
8.24
42.08
165.9
2
11
江苏
18.61
122.51
27.07
42.5
63.47
15.38
36.14
240.92
2
12
安徽
19.61
107.13
32.85
35.77
61.43
7.53
34.6
142.23
2
13
福建
25.56
171.65
22.3
40.53
57.13
12.6
54.03
225.08
2
14
江西
18.75
104.68
15.55
35.61
51.8
11.18
36.27
142.72
2
15
山东
18.27
88.34
19.07
43.19
72.97
12.59
42.16
200.18
2
16
河南
19.07
73.18
18.01
29.38
64.51
8.91
38.14
155.45
2
17
湖北
18.76
102.67
21.87
30.47
64.33
11.99
42.14
168.17
2
18
湖南
20.25
104.45
20.72
38.15
62.98
12.67
39.16
213.56
2
19
广西
18.7
131.35
11.69
32.06
41.54
10.84
42.77
178.51
2
20
海南
16.16
139.92
12.98
23.58
24.87
10.76
32.35
144.21
2
21
重庆
18.18
120.39
26.18
37.94
68.16
11.64
38.48
246.37
2
22
四川
18.53
109.95
21.49
33.04
50.98
10.88
33.96
183.85
2
23
贵州
18.33
92.43
25.38
32.19
56.32
14
38.57
144.82
2
24
云南
22.3
99.08
33.36
32.01
52.06
7.04
32.85
190.04
2
25
陕西
20.03
70.75
19.75
34.95
53.29
10.55
38.2
189.41
2
26
甘肃
18.68
72.74
23.72
38.69
62.41
9.65
35.26
170.12
2
27
青海
20.33
75.64
20.88
33.85
53.81
10.06
32.82
171.32
2
28
宁夏
19.75
70.24
18.67
36.71
61.75
10.08
40.26
165.22
2
2