应用回归分析第9章课后习题答案Word下载.docx
《应用回归分析第9章课后习题答案Word下载.docx》由会员分享,可在线阅读,更多相关《应用回归分析第9章课后习题答案Word下载.docx(17页珍藏版)》请在冰点文库上搜索。
6
277
7
12
210
8
19
120
9
290
10
16
238
11
28
164
股份
15
272
13
295
14
38
68
85
224
20
166
18
305
124
246
解:
对定型变量“公司类型”进行数量化处理:
引入虚拟变量X2:
公司类型为“互助”时,X:
=l,为“股份”
时,x:
=0o
则表9.5中数据转换成以下数据:
X1
建立回归方程y=bo+biXi+b2X2+£
用SPSS软件作线性回归,得到输出结果如下:
ModelSummary
Model
R
RSquare
AdjustedRSquare
Std.&
roroftheEstimate
.946a
.895
.883
3.221
a.Predictors:
(Constant),公司类型,x1
R检验:
拟合优度R-0.883,接近1,说明回归拟合的效果较好。
ANOVAb
SumofSquares
df
MeanSquare
F
Sig.
1Regression
ResidualTotal
1504.413
176.387
1680.800
752.207
10.376
72.497
.000a
(Constant),公司类型
b・DependentVariable:
y
F检验:
F值二72.497,Sig.值为0,说明回归方程通过F检验。
Coefficients
UnstandCoeffi
ardizedcients
StandardizedCoefficients
t
Siq.
B
ror
Beta
1(Constant)
41.930
-.102
-8.055
2.010
.009
1.459
-.439
20.859
・11.443
-5.521
.000
a.DependentVariable:
T检验:
回归系数通过t检验,回归方程为:
y=41.930—0.102xl&
055x2
说明:
若引入虚拟变量X:
当公司类型为“互助”时,x==0,为“股
份”时,X3=lo
则回归方程为:
y=33.874-0.102X1+8.055x结果分析:
(1)股份制公司采取保险革新措施的积极性比互助型公司高,原因可能在于股份制公司建立在共同承担风险上,所以更愿意革新;
(2)公司规模越大,采取保险革新措施的倾向越大:
大规模公司的保险制度的更新对公司的影响程度比小规模公司大,因此大规模公司更倾向于比较更新措施和现有政策带来的效益,最终表现在采纳革新措施的时间间隔较短。
9.4.表9.9的数据是我国历年铁路里程数据,根据散点图观察在某时间点有折点,用折线回归拟合这个数据。
由散点图9(见下图)可看出在1995年(t=16)有折点,考虑由两段构成的分段线性回归,这可以通过引入一个0-1型虚拟自变量实现。
由散点图可知该折点为t=16,则引入虚拟自变量;
v,
'
0,r<
t-16j>
■
由SPSS输岀的调整后的决定系数用=0.980,说明拟合优度较好。
由输出的系数表可以得出回归方程为:
y=5.183+0.055/+0.106^由SPSS输岀方程分析表可知,F值为594.524,且P值约为零,说明回归方程非常显著;
系数表中回归参数对应的t检验P值都约等于零,说明回归参数均通过了显著性检验。
因此,折线方程成立。
5.00-
散点图
方差分析表
11.113
.206
11.319
24
5.557
594.524
(Constant),x,tb・DependentVariable:
系数表
UnstandCoeffi
StandardizedCoefficients
Std.Error
X
5.183
.055
.106
.049
.005
.012
.589
.450
106.303
11.859
9.065
a・DependentVariable:
9.5某省统计局1990年9月在全省围进行了一次公众安全感问卷调查,参考文献【10】选取了调查表中的一个问题进行分析。
本题对其中的数据做了适当的合并。
对1391人填写的问卷设计:
“一人在家是否害怕生人来”。
因变量y=l表示害怕,y二2表示不害怕。
2个自变量:
xl是年龄,x2是文化程度。
各变量的取值含义如表9.10所示。
表9.10
是否害怕y
年龄xl
文化程度x2
害怕1
16-
28岁
文盲0
不害怕0
29-
—45岁
37
小学1
46-
—60岁
53
中学2
61岁以上
中专以上3
现在的问题是:
公民一人在家害怕生人来这个事件,与公民的年龄
xl、文化程度x2有没有关系呢?
调查数据见表9.11。
表9.11
号
X2
m
y=l
y二0
Pi
0.1250
389
146
243
0.2916
83
57
0.3756
27
487
196
291
0.3154
103
76
535
0.7000
188
73
115
0.6607
47
29
0.4026
0.2644
0.4500
0.5000
0.3888
0.3854
0.1666
0.3181
其中,p是根据(9.44)式计算的。
(1)把公民的年龄xl、文化程度x2作为数值型变量,建立y对xl、x2的logistic回归。
(2)把公民的年龄xl、文化程度x2作为定性型变量,用0-1变量将其数量化,建立y对公民的年龄和文化程度的logistic回归。
(3)你对回归的效果是否满意,你认为主要的问题是什么?
解:
(1)先对巳进行逻辑变换,令分=皿厶),贝U
1-门
门'
=几+0丙+02兀2+勺
直接用SPSS进行y与xl、x2的logistic回归,输出结果如下:
ANOV¥
.562
9.459
10.020
.281
.728
.386
.687a
a.FYedictors:
(Constant),x2,x1b・DependentVariable:
ppi
X1x2
-.144
-.006
-.136
.662
.191
「37
-.193
・.218
-.510
-.715
.831
.619
.487
由SPSS输出系数表结果得到回归方程:
pf=-0.144-0.006A--0.136a2则还原后logistic回归方程为:
’_exp(-0」44一0.006£
-0.136心)p=—
l+exp(-0.144-0.006^-0.136x2)
由方差分析表知F值=0.386,P值=0.687,大于5%,说明回归方程不显著;
由系数表知回归参数的t检验均没有通过,因为P值都大于5%,说明回归参数未通过显著性检验。
由于logistic回归模型存在异方差,所以采用加权最小二乘法重新拟
合,权重:
卩=也(1-门)
SPSS输出结果如下:
ANOV申c
8.393
12.676
21.069
4.197
.975
4.304
.037a
(Constant),x2,x1
c.WeightedLeastSquaresRegression・Weightedbywi
Coefficient^
Std.Bror
x2
.146
.002
-.331
.309
.116
.086
-.617
.472
.398
-2.858
.645
.697
.013
b・WeightedLeastSquaresRegression・Weightedbywi
由输出结果得到回归方程:
尸=0.146+0.002“-0.331x2
还原后的回归方程:
迁冈(0」46+().002匸().331仝_
1+exp(0.146+0.002X]-0.331x2)
由方差分析表结果知:
F值二4.304,P值二0.037,小于5%,说明回归方程显著;
由系数表知“对应的回归系数相应的P值二0.697,大于5%,说明坷对应的回归系数没有通过检验,不显著;
心对应的回归系数相应的P值=0.013,小于5%,说明心对应的回归系数通过检显著性验,且该回归系数为-0.331,,表明文化程度越高越不害怕。
(2)把公民的年龄xl、文化程度x2作为定性型变量,引入6个0-1
变量表示年龄小
1)直接进行y与6个虚拟变量的未加权的logistic回归,SPSS输
出结果如下:
由方差分析表知F二2.472,P值=0.106,大于5%,说明回归方程不显著;
且除了切外,其它自变量对应的回归系数都没通过检验。
4.743
5.277
1.186
.480
2.472
.106*
(Constant),x13,x2,x12tx11b・DependentVariable:
X11
x12
x13
・1.044
.220
1.273
.969
.417
.155
.490
.120
.530
-2.505
-.881
.449
2.600
1.979
.029
.397
.025
.073
下而通过后退法选择变量对上述模型改进。
SPSS输出结果如下表:
ANOV卅
Regression
Residual
Total
・106a
RegressionResidualTotal
4.647
5.374
1.549
.448
3.459
・05卩
4.274
5.746
2.137
.442
4.835
.027°
a・FYedictors:
(Constant),x13,x2,x12,x11b・Predictors:
(Constant),x13,x2,x12
c.Predictors:
(Constant),x13,x12
d・DependentVariable:
UnstandardizedCoefficients
(Constant)
-1.044
-.934
.326
-2.865
.014
.150
■92
.380
1.163
.410
.636
2.838
.015
.859
.470
2.097
.058
-1.139
.235
・4.846
.407
2.857
•470
2.110
后退法的过程中剔除了心宀,留下了巾,但是切对应的回归系数
未通过检验,将其剔除,最后留下了切;
而且回归方程显著,
2)加权回归:
用后退法选择变量,由输出结果(如下)可知最后只
留下了心。
ANOV増
RegressionResidual
9.979
11.090
2.495
1.008
2.475
.106a
RegressionResidualTotal
9.526
11.543
3.175
.962
3.301
.058°
8.870
12.199
4.435
.938
4.726
.029c
RegressionResidual
8.238
12.831
.916
8.989
.010d
(Constant),x13?
x2,x11,x12
b・R-edictors:
(Constant),x13,x2,x12
c.FVedictors:
(Constant),x2,x12
d.R-edictors:
(Constant),x2
e.DependentVariable:
f-WeightedLeastSquaresRegression-Weightedbywi
Coefficient^6
UnstandardizedCoefficients
-.092
.425
・.217
.832
-.344
.118
-.641
-2.901
.263
.392
.671
.516
X12
.379
.389
.737
.351
X13
.376
.402
.570
.936
.370
.131
.258
.510
-.332
.115
-.620
-2.902
.132
.122
.257
1.086
.299
.129
.156
.195
.826
.177
.248
.713
.489
・.334
.113
-.623
-2.950
.011
.089
.109
.173
.820
.427
-.335
.240
.112
-.625
.915
-2.998
.375
.010
aDependentVariable:
b・WeightedLeastSquaresRegression・Weightedb