应用回归分析习题413答案.docx
《应用回归分析习题413答案.docx》由会员分享,可在线阅读,更多相关《应用回归分析习题413答案.docx(16页珍藏版)》请在冰点文库上搜索。
应用回归分析习题413答案
4.13
(1)用普通最小二乘法建立y与x回归方程.
(2)用残差图及DW检验诊断序列的自相关
datadxh;
inputobsxy;
cards;
1127.320.96
213021.4
3132.721.96
4129.421.52
513522.39
6137.122.76
7141.123.48
8142.823.66
9145.524.1
10145.324.01
11148.324.54
12146.424.28
13150.225
14153.125.64
15157.326.46
16160.726.98
17164.227.52
18165.627.78
19168.728.24
2017228.78
;
run;
procprint;
run;
procgplotdata=dxh;
ploty*x;
run;
procregdata=dxh;
modely=x/clbprspecdw;
outputout=outr=residual;
run;
方差分析
源
自由度
平方
和
均方
F值
Pr>F
模型
1
110.59832
110.59832
11648.6
<.0001
误差
18
0.17090
0.00949
校正合计
19
110.76922
P值<0.05,回归方程显著。
均方根误差
0.09744
R方
0.9985
因变量均值
24.57300
调整R方
0.9984
变异系数
0.39653
R方=0.9985,调整R方=0.9984,所以回归方程拟合度较高.
参数估计值
变量
自由度
参数
估计值
标准
误差
t值
Pr>|t|
95%置信限
Intercept
1
-1.43483
0.24196
-5.93
<.0001
-1.94316
-0.92650
x
1
0.17616
0.00163
107.93
<.0001
0.17273
0.17959
常数项和x的参数估计P值均小于0.05,所以参数显著有效
回归方程为y=-1.43483+0.17616
残差图成发散状,可能存在异方差。
Durbin-WatsonD
0.663
观测数
20
第一阶自相关
0.644
查DW分布表可知n=20,P=2时临界值dL和dU分别为1.20和1.41,由于DW值=0.663小于dL,故模型存在序列正自相关性.
(3)用迭代法处理序列相关,并建立回归方程
datadxh1;
setout;
ro=1-0.5*0.663;
y_t_1=y-ro*lag1(y);
x_t_1=xro*lag1(x);
run;
procprintdata=dxh1;;
run;
procregdata=dxh1;
modely_t_1=x_t_1/clbprspecDW;
run;
方差分析
源
自由度
平方
和
均方
F值
Pr>F
模型
1
13.13330
13.13330
2467.41
<.0001
误差
17
0.09049
0.00532
校正合计
18
13.22379
P值<0.05,回归方程显著。
均方根误差
0.07296
R方
0.9932
因变量均值
8.48413
调整R方
0.9928
变异系数
0.85992
由R方和调整R方知,方程拟合度较高。
参数估计值
变量
自由度
参数
估计值
标准
误差
t值
Pr>|t|
95%置信限
Intercept
1
-0.30006
0.17763
-1.69
0.1094
-0.67483
0.07471
x_t_1
1
0.17268
0.00348
49.67
<.0001
0.16535
0.18002
常数性参数检验的p值=0.1094大于0.05,不显著,除去常数项再建立回归方程.
Durbin-WatsonD
1.360
观测数
19
第一阶自相关
0.293
又由DW=1.306,查DW知,n=19,k=2时.可知dL=1.18,dU=1.40,DW=1.360在dL和dU之间,所以迭代法建立的回归方程的误差项无自相关.
去掉常数项建回归方程。
procregdata=dxh1;
modely_t_1=x_t_1/nointclbprspecDW;
run;
结果如下:
方差分析
源
自由度
平方
和
均方
F值
Pr>F
模型
1
1380.74604
1380.74604
235188
<.0001
误差
18
0.10567
0.00587
未校正合计
19
1380.85172
P值<0.05,回归方程显著。
均方根误差
0.07662
R方
0.9999
因变量均值
8.48413
调整R方
0.9999
变异系数
0.90311
由R方和调整R方知,方程拟合度较高。
参数估计值
变量
自由度
参数
估计值
标准
误差
t值
Pr>|t|
95%置信限
x_t_1
1
0.16684
0.00034402
484.96
<.0001
0.16611
0.16756
P值<0.05,参数估计显著有效。
回归方程:
.
其中
=
.
(3)用一阶差分法处理数据,并建立回归方程
datadxh2;
seta;
difx=x-lag1(x);
dify=y-lag1(y);
run;
procregdata=dxh2;
modeldify=difx/rpDW;
run;
结果如下:
方差分析
源
自由度
平方
和
均方
F值
Pr>F
模型
1
2.11593
2.11593
381.34
<.0001
误差
17
0.09433
0.00555
校正合计
18
2.21025
P值<0.05,回归方程显著。
均方根误差
0.07449
R方
0.9573
因变量均值
0.41158
调整R方
0.9548
变异系数
18.09839
由R方和调整R方知,方程拟合度较高。
参数估计值
变量
自由度
参数
估计值
标准
误差
t值
Pr>|t|
Intercept
1
0.03289
0.02585
1.27
0.2203
difx
1
0.16096
0.00824
19.53
<.0001
回归方程为:
其中
,
.
Durbin-WatsonD
1.480
观测数
19
第一阶自相关
0.253
DW=1.480,查DW,n=19,k=2.可知
和
分别为1.18和1.40,DW=1.480在1.40和4-1.40之间,误差项间无自相关.
(4)比较以上各方法所建回归方程的优良性.
在回归模型不存在序列相关时,普通最小二乘法比迭代法和一阶差分法操作起来更简便,但是,当一个回归模型存在序列相关性时,普通最小二乘法所建立的回归方程就不适用了,这时需要使用迭代法或一阶差分法。
由于一阶差分法的应用条件是自相关系数P=1,当P接近1时,一阶差分法比迭代法好,当原模型存在较高程度的一阶自相关时,一般使用一阶差分法,因为一阶差分法比迭代法简单而且迭代法需要用样本估计自相关系数P,对P的估计误差会影响迭代法的使用效率,同时迭代法的算法时间复杂度比一阶差分的高,在效率上不如一阶差分好。
4.14
(1)用最小二乘法建立回归方程,用残差图及DW检验诊断序列的自相关性
datadxh;
inputyx1x2@@;
cards;
893.935292
1091.275252
1229.975267
1045.855379
997.245318
1495.146393
1200.565331
747.244204
866.435266
6035253
343.525315
472.16271
171.794166
135.794204
925.955335
1574.015352
1405.335274
971.274333
1165.25302
597.854324
490.344327
709.595206
987.35310
954.66306
1216.896350
1491.525275
668.34173
915.035360
565.924340
1267.985380
930.246285
379.384232
500.745294
83.655220
982.946391
722.284279
1337.445322
1150.514231
1514.846368
1442.085357
767.645260
1020.035298
1067.495350
1484.126320
957.684227
1344.915261
1361.785303
1424.696263
1158.214215
827.564294
803.164288
1447.466257
;
run;
procprintdata=dxh;
run;
procregdata=dxh;
modely=x1x2/clbprspecDW;
outputout=outr=residual;
run;
procgplotdata=out;
plotresidual*y;
run;
方差分析
源
自由度
平方
和
均方
F值
Pr>F
模型
2
2205552
1102776
10.15
0.0002
误差
49
5326177
108697
校正合计
51
7531729
P值<0.05,回归方程显著。
参数估计值
变量
自由度
参数
估计值
标准
误差
t值
Pr>|t|
95%置信限
Intercept
1
-574.06239
349.27075
-1.64
0.1067
-1275.94824
127.82346
x1
1
191.09849
73.30917
2.61
0.0121
43.77821
338.41878
x2
1
2.04514
0.91069
2.25
0.0293
0.21504
3.87524
回归分析方程:
Durbin-WatsonD
0.745
观测数
52
第一阶自相关
0.615
DW值=0.745
.
残差图满足线性关系,可建立回归方程。
(2)用迭代法处理序列相关,并建立回归方程
datadxh1;
setout;
ro=1-0.5*0.745;
y_t_1=y-ro*lag1(y);
x1_t_1=x1-ro*lag1(x1);
x2_t_1=x2-ro*lag1(x2);
run;
procprintdata=dxh1;
run;
procregdata=dxh1;
modely_t_1=x1_t_1x2_t_1/clbprspecdw;
Run;
方差分析
源
自由度
平方
和
均方
F值
Pr>F
模型
2
2865658
1432829
21.55
<.0001
误差
48
3191497
66490
校正合计
50
6057155
P值<0.05,回归方程显著。
参数估计值
变量
自由度
参数
估计值
标准
误差
t值
Pr>|t|
95%置信限
Intercept
1
-178.77522
90.33819
-1.98
0.0536
-360.41232
2.86189
x1_t_1
1
211.11043
47.74732
4.42
<.0001
115.10802
307.11285
x2_t_1
1
1.43648
0.62864
2.29
0.0268
0.17253
2.70044
所得回归方程:
其中
,
,
Durbin-WatsonD
1.716
观测数
51
第一阶自相关
0.122
DW=1.716在
和4-
之间,误差项无自相关.
(3)用一阶差分法处理数据
Data=dxh2;
seta;
dify=y-lag1(y);
difx1=x1-lag1(x1);
difx2=x2-lag1(x2);
run;
procregdata=dxh2;
modeldify=difx1difx2/rdw;
run;
方差分析
源
自由度
平方
和
均方
F值
Pr>F
模型
2
4033892
2016946
25.04
<.0001
误差
48
3865792
80537
校正合计
50
7899684
P值<0.05,回归方程显著。
参数估计值
变量
自由度
参数
估计值
标准
误差
t值
Pr>|t|
Intercept
1
7.69810
39.75421
0.19
0.8473
difx1
1
209.89106
44.14316
4.75
<.0001
difx2
1
1.39898
0.58282
2.40
0.0203
回归方程:
其中
,
,
(4)比较以上各方法所建回归方程的优良性
在回归模型不存在序列相关时,普通最小二乘法比迭代法和一阶差分法操作起来更简便,但是,当一个回归模型存在序列相关性时,普通最小二乘法所建立的回归方程就不适用了,这时需要使用迭代法或一阶差分法.由于一阶差分法的应用条件是自相关系数P=1,当P接近1时,一阶差分法比迭代法好,当原模型存在较高程度的一阶自相关的情况时,一般使用一阶差分法而不用迭代法,因为一阶差分法比迭代法简单而且迭代法需要用样本估计自相关系数P,对P的估计误差会影响迭代法的使用效率,同时迭代法的算法时间复杂度比一阶差分的高,在效率上不如一阶差分好。