计量经济学上机作业试题以及答案.docx
《计量经济学上机作业试题以及答案.docx》由会员分享,可在线阅读,更多相关《计量经济学上机作业试题以及答案.docx(57页珍藏版)》请在冰点文库上搜索。
计量经济学上机作业试题以及答案
题目:
第一题:
根据下列数据建模并估计结果,并力求使得拟合效果最好。
Y
X1
X2
17.2
12.5
0.107
18.85
13.7
0.105
16.71
11.3
0.104
14.81
10.4
0.102
19.02
14.2
0.101
20.55
15.2
0.093
24.29
17.1
0.091
24.38
16.9
0.130
27.8
17.2
0.110
43.01
18.46
0.093
65.65
19.9
0.102
67.05
20.3
0.115
88.25
21.5
0.101
78.15
20.9
0.104
91.485
22.11
0.102
110.3
23.8
0.098
第二题:
下表中,Y代表新客车出售量,X1代表新车价格指数,X2代表消费者价格指数,X3代表个人可支配收入,X4代表利率,X5代表就业人数。
试建模并估计结果。
年度
Y
X1
X2
X3
X4
X5
1971
10227
112
121.3
776.8
4.89
79367
1972
10872
111
125.3
839.6
4.55
82153
1973
11350
111.1
133.1
949.8
7.38
85064
1974
8775
117.5
147.7
1038.4
8.61
86794
1975
8539
127.6
161.2
1142.8
6.16
85846
1976
9994
135.7
170.5
1252.6
5.22
88752
1977
11046
142.9
181.5
1379.3
5.5
92017
1978
11164
153.8
195.3
1551.2
7.78
96048
1979
10559
166
217.7
1729.3
10.25
98824
1980
8979
179.3
247
1918
11.28
99303
1981
8535
190.2
272.3
2127.6
13.73
1982
7980
197.6
286.6
2261.4
11.2
99526
1983
9179
202.6
297.4
2428.1
8.69
1984
10394
208.5
307.6
2670.6
9.65
1985
11039
215.2
318.5
2841.1
7.75
1986
11450
224.4
323.4
3022.1
6.31
第三题
为了了解影响电信业务的发展情况,特收集了如下数据,请建模并估计合理的结果。
年
电信业务总量
邮政业务总量
中国人口数
市镇人口比重
人均GDP
人均消费水平
1991
1.5163
0.5275
11.5823
0.2637
1.879
0.896
1992
2.2657
0.6367
11.7171
0.2763
2.287
1.070
1993
3.8245
0.8026
11.8517
0.2814
2.939
1.331
1994
5.9230
0.9589
11.9850
0.2862
3.923
1.746
1995
8.7551
1.1334
12.1121
0.2904
4.854
2.236
1996
12.0875
1.3329
12.2389
0.2937
5.576
2.641
1997
12.6895
1.4434
12.3626
0.2992
6.053
2.834
1998
22.6494
1.6628
12.4810
0.3040
6.307
2.972
1999
31.3238
1.9844
12.5909
0.3089
6.534
3.143
第四题:
X代表职工的工龄,Y代表薪水。
要求:
1.通过散点图或残差图对样本进行初步观察。
2.对可能存在的问题进行检验。
3.采取措施消除问题。
4.写出最终表达式。
X
Y
0.5
69000
2.5
70500
4.5
74050
6.5
82600
8.5
91439
10.5
83127
12.5
84700
14.5
82601
16.5
93286
18.5
90400
20.5
98200
23
26
99662
30
34
85200
第五题:
处于研究的目的,现需要了解A和B两个经济变量的联系,但是没有先验信息提示A和B的关系,请根据所学知识进行处理。
A
B
36.99
52.805
33.6
55.906
35.42
63.027
42.35
72.931
52.48
84.79
53.66
86.589
58.53
98.797
67.48
113.201
78.13
126.905
95.13
143.936
112.6
154.391
128.68
168.129
123.97
163.351
117.35
172.547
139.61
190.682
152.88
194.538
137.95
194.657
141.06
206.326
163.45
223.541
183.8
232.724
192.61
239.459
182.81
235.142
第六题
下列数据中,X表示家庭收入,Y表示家庭支出,请对如下数据运用戈德菲尔德-匡特检验。
X
Y
80
55
100
65
85
70
110
80
120
79
115
84
130
98
140
95
125
90
90
75
105
74
160
110
150
113
165
125
145
108
180
115
225
140
200
120
240
145
185
130
220
152
210
144
245
175
260
180
190
135
205
140
265
178
270
191
230
137
250
189
第七题:
下表中,C代表某年度美国国内平均铜价,G代表年度GNP,I代表年度平均工业生产指数,L代表年度平均伦敦金属交易所铜价,H代表新房动工数,A代表年度平均铝价。
要求:
试建立模型拟合美国铜价的变化(提示:
消除自相关问题),并比较自相关问题解决前后回归估计的结果。
年度
C
G
I
L
H
A
Y
X1
X2
X3
X4
X5
1951
21.89
330.2
45.1
220.4
1491
19
1952
22.29
347.2
50.9
259.5
1504
19.41
1953
19.63
366.1
53.3
256.3
1438
20.93
1954
22.85
366.3
53.6
249.3
1551
21.78
1955
33.77
399.3
54.6
352.3
1646
23.68
1956
39.18
420.7
61.1
329.1
1349
26.01
1957
30.58
442
61.9
219.6
1224
27.52
1958
26.3
447
57.9
234.8
1382
26.89
1959
30.7
483
64.8
237.4
1553.7
26.85
1960
32.1
506
66.2
245.8
1296.1
27.23
1961
30
523.3
66.7
229.2
1365
25.46
1962
30.8
563.8
72.2
233.9
1492.5
23.88
1963
30.8
594.7
76.5
234.2
1634.9
22.62
1964
32.6
635.7
81.7
347
1561
23.72
1965
35.4
688.1
89.8
468.1
1509.7
24.5
1966
36.6
753
97.8
555
1195.8
24.5
1967
38.6
796.3
100
418
1321.9
24.98
1968
42.2
868.5
106.3
525.2
1545.4
25.58
1969
47.9
935.5
111.1
620.7
1499.5
27.18
1970
58.2
982.4
107.8
588.6
1469
28.72
1971
52
1063.4
109.6
444.4
2084.5
29
1972
51.2
1171.1
119.7
427.8
2378.5
26.67
1973
59.5
1306.6
129.8
727.1
2057.5
25.33
1974
77.3
1412.9
129.3
877.6
1352.5
34.06
1975
64.2
1528.8
117.8
556.6
1171.4
39.79
1976
69.6
1700.1
129.8
780.6
1547.6
44.49
1977
66.8
1887.2
137.1
750.7
1989.8
51.23
1978
66.5
2127.6
145.2
709.8
2023.3
54.42
1979
98.3
2628.8
152.5
935.7
1749.2
61.01
1980
101.4
2633.1
147.1
940.9
1298.5
70.87
参考答案:
(本人自己做的,只供参考)
姓名:
徐任
学号:
专业:
数经班
第一题
解:
先对原使数据建立模型:
Y=C
(1)*X1+C
(2)*X2+C(3),
具体回归分析结果(结果一):
DependentVariable:
Y
Method:
LeastSquares
Date:
12/24/10Time:
14:
49
Sample:
116
Includedobservations:
16
Y=C
(1)*X1+C
(2)*X2+C(3)
Coefficient
Std.Error
t-Statistic
Prob.
C
(1)
7.
0.
8.
0.0000
C
(2)
-199.9262
378.0811
-0.
0.6059
C(3)
-60.30901
42.76070
-1.
0.1819
R-squared
0.
Meandependentvar
45.46906
AdjustedR-squared
0.
S.D.dependentvar
32.55622
S.E.ofregression
13.70940
Akaikeinfocriterion
8.
Sumsquaredresid
2443.321
Schwarzcriterion
8.
Loglikelihood
-62.93121
Durbin-Watsonstat
0.
但是,这里存在这很多问题。
首先,考虑到Y,X1,X2的CorrelationMatrix:
X1
X2
Y
X1
1.
-0.
0.
X2
-0.
1.
-0.
Y
0.
-0.
1.
注意到Y与X2的相关系数仅为-0.,故X2对Y的解释能力有限,应当去除。
以下,仅考虑X1对Y的影响。
先建立模型:
Y=C
(1)*X1+C
(2),
具体回归分析结果(结果二):
DependentVariable:
Y
Method:
LeastSquares
Date:
12/24/10Time:
15:
30
Sample:
116
Includedobservations:
16
Y=C
(1)*X1+C
(2)
Coefficient
Std.Error
t-Statistic
Prob.
C
(1)
7.
0.
8.
0.0000
C
(2)
-81.40120
15.00815
-5.
0.0001
R-squared
0.
Meandependentvar
45.46906
AdjustedR-squared
0.
S.D.dependentvar
32.55622
S.E.ofregression
13.35203
Akaikeinfocriterion
8.
Sumsquaredresid
2495.875
Schwarzcriterion
8.
Loglikelihood
-63.10146
Durbin-Watsonstat
0.
经过改良后的结果尽管X1的t值很高,即其解释能力很强,
但是对于随机项才C
(2),其t值居然为-5.,
这让我们不得不怀疑是否存在其他解释变量,对Y有明显影响
考虑Y与X1的散点图:
注意到,Y相对于X1的并不是以一个恒定速率增大,而是存在着一个拐点,
在拐点之前,Y增大速率较平缓,而在拐点之后,Y增大的速率明显变快。
且拐点可从上图中其值在17左右,不妨设立虚拟变量
,
新的数据具体如下:
Y
X1
Di
17.2
12.5
0
18.85
13.7
0
16.71
11.3
0
14.81
10.4
0
19.02
14.2
0
20.55
15.2
0
24.29
17.1
0
24.38
16.9
0
27.8
17.2
1
43.01
18.46
1
65.65
19.9
1
67.05
20.3
1
88.25
21.5
1
78.15
20.9
1
91.485
22.11
1
110.3
23.8
1
现在建立模型:
Y=C
(1)*X1+C
(2)*DI+C(3)
其具体回归分析结果(结果三):
DependentVariable:
Y
Method:
LeastSquares
Date:
12/24/10Time:
16:
41
Sample:
116
Includedobservations:
16
Y=C
(1)*X1+C
(2)*DI+C(3)
Coefficient
Std.Error
t-Statistic
Prob.
C
(1)
6.
1.
3.
0.0018
C
(2)
11.24638
12.43136
0.
0.3821
C(3)
-66.28653
22.52412
-2.
0.0114
R-squared
0.
Meandependentvar
45.46906
AdjustedR-squared
0.
S.D.dependentvar
32.55622
S.E.ofregression
13.43946
Akaikeinfocriterion
8.
Sumsquaredresid
2348.049
Schwarzcriterion
8.
Loglikelihood
-62.61303
Durbin-Watsonstat
0.
虽然已经加入了虚拟变量,但是仍然存在着两点问题:
一,C(3)的t值仅为-2.,不够显著
二,
值仅为0.,表示模型的解释能力不够显著
现对模型进行修正:
Y=C
(1)*X1+C
(2)*DI+C(3)*DI*X1+C(4)
其具体回归分析结果(结果四):
DependentVariable:
Y
Method:
LeastSquares
Date:
12/24/10Time:
16:
44
Sample:
116
Includedobservations:
16
Y=C
(1)*X1+C
(2)*DI+C(3)*DI*X1+C(4)
Coefficient
Std.Error
t-Statistic
Prob.
C
(1)
1.
0.
4.
0.0007
C
(2)
-192.2418
8.
-22.37019
0.0000
C(3)
11.45516
0.
24.23526
0.0000
C(4)
0.
4.
0.
0.9624
R-squared
0.
Meandependentvar
45.46906
AdjustedR-squared
0.
S.D.dependentvar
32.55622
S.E.ofregression
1.
Akaikeinfocriterion
4.
Sumsquaredresid
47.01208
Schwarzcriterion
4.
Loglikelihood
-31.32554
Durbin-Watsonstat
1.
故:
Y=1.X1-192.2418DI+11.4551DI*X1+0.
第二题
解:
建立模型:
Y=C
(1)*X1+C
(2)*X2+C(3)*X3+C(4)*X4+C(5)*X5+C(6)
其具体回归分析结果(结果一):
DependentVariable:
Y
Method:
LeastSquares
Date:
12/24/10Time:
17:
22
Sample:
116
Includedobservations:
16
Y=C
(1)*X1+C
(2)*X2+C(3)*X3+C(4)*X4+C(5)*X5+C(6)
Coefficient
Std.Error
t-Statistic
Prob.
C
(1)
50.53776
69.70081
0.
0.4850
C
(2)
-103.5042
51.14744
-2.
0.0705
C(3)
6.
3.
1.
0.1306
C(4)
-105.9787
151.9428
-0.
0.5014
C(5)
0.
0.
1.
0.3367
C(6)
2933.906
8172.257
0.
0.7271
R-squared
0.
Meandependentvar
10005.13
AdjustedR-squared
0.
S.D.dependentvar
1163.645
S.E.ofregression
706.1345
Akaikeinfocriterion
16.23749
Sumsquaredresid
.
Schwarzcriterion
16.52721
Loglikelihood
-123.8999
Durbin-Watsonstat
1.
X1
X2
X3
X4
X5
Y
X1
1.
0.
0.
0.
0.
-0.
X2
0.
1.
0.
0.
0.
-0.
X3
0.
0.
1.
0.
0.
0.
X4
0.
0.
0.
1.
0.
-0.
X5
0.
0.
0.
0.
1.
0.
Y
-0.
-0.
0.
-0.
0.
1.
观察到X5与X1,X5与X2,X5与X3的相关系数分别为 0., 0. ,0.。
均接近一,而X3与X1,X3与X2的相关系数为 0., 0.也接近一,即存在着多重共线性问题。
为去除多重共线性,进行逐步回归。
分别作Y与X1,X2,X3,X4,X5间的回归:
以下是具体回归结果:
(结果二、1):
DependentVariable:
Y
Method:
LeastSquares
Date:
12/25/10Time:
22:
47
Sample:
116
Includedobservations:
16
Y=C
(1)*X1+C
(2)
Coefficient
Std.Error
t-Statistic
Prob.
C
(1)
-1.
7.
-0.
0.8076
C
(2)
10311.80
1271.702
8.
0.0000
R-squared
0.
Meandependentvar
10005.13
Ad