虚拟变量及logistic回归练习题.docx

上传人:b****8 文档编号:9680722 上传时间:2023-05-20 格式:DOCX 页数:13 大小:19.93KB
下载 相关 举报
虚拟变量及logistic回归练习题.docx_第1页
第1页 / 共13页
虚拟变量及logistic回归练习题.docx_第2页
第2页 / 共13页
虚拟变量及logistic回归练习题.docx_第3页
第3页 / 共13页
虚拟变量及logistic回归练习题.docx_第4页
第4页 / 共13页
虚拟变量及logistic回归练习题.docx_第5页
第5页 / 共13页
虚拟变量及logistic回归练习题.docx_第6页
第6页 / 共13页
虚拟变量及logistic回归练习题.docx_第7页
第7页 / 共13页
虚拟变量及logistic回归练习题.docx_第8页
第8页 / 共13页
虚拟变量及logistic回归练习题.docx_第9页
第9页 / 共13页
虚拟变量及logistic回归练习题.docx_第10页
第10页 / 共13页
虚拟变量及logistic回归练习题.docx_第11页
第11页 / 共13页
虚拟变量及logistic回归练习题.docx_第12页
第12页 / 共13页
虚拟变量及logistic回归练习题.docx_第13页
第13页 / 共13页
亲,该文档总共13页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

虚拟变量及logistic回归练习题.docx

《虚拟变量及logistic回归练习题.docx》由会员分享,可在线阅读,更多相关《虚拟变量及logistic回归练习题.docx(13页珍藏版)》请在冰点文库上搜索。

虚拟变量及logistic回归练习题.docx

虚拟变量及logistic回归练习题

虚拟变量回归练习题

1、请根据下表数据建立回归模型来分析食品支出与税后收入和性别的关系

(1)请建立性别对食品支出影响的回归模型

横型汇总b

模型

R

R方

调整R方

标准估计的误差

Durbin-Watson

1

.435°

.189

.108

570.84045

1.582

a.预测变量:

(常量),性别。

b.因变量:

食品支出

Anovab

模型

平方和

df

均方

F

Sig.

1

回归

759530.083

1

759530.083

2.331

.158°

残差

3258588.167

10

325858.817

总计

4018118.250

11

a•预测变量:

(常量),性别。

b•因变量:

食品支出

系数。

模型

非标准化系数

标准系数

t

sig-

B

标准误差

试用版

1

(常量)

2170.500

521.104

4.165

.002

性别

503.167

329.575

.435

1.527

.158

a•因变量:

食品支出

通过上述模型统计分析,我们可以得到如下结论:

得到的P二0・158>0・05,所

以接受原假设,所以性别对食品支出无显著差异。

(2)请建立考虑了税后收入和性别两个自变量对食品支出影响的回归模型,并

进行解释。

模型汇总b

模型

R

R方

调整R方

标准估计的误差

Durbin-Watson

1

.964°

.928

.913

178.76928

1.926

a•预测变量:

(常量),

性别,税后收入。

b.因变量:

食品支出

Anovab

模型

平方和

df

均方

F

Sig.

1

回归

3730492.144

2

1865246.072

58.365

.000°

残差

287626.106

9

31958.456

总计

4018118.250

11

a•预测变量:

(常量),性别,税后收入。

b.因变量:

食品支出

系数。

模型

非标准化系数

标准系数

t

Sig.

B

标准误差

试用版

1

(常量)

1048.271

200.448

5.230

.001

税后收入

.059

.006

.892

9.642

.000

性别

228.987

107.058

.198

2.139

.061

a•因变量:

食品支出

通过上述统计分析我们可以得到如下结论:

在同时考虑税后收入和性别对食

品支出的影响时,税后收入P=0<0.05,随意拒绝原假设,所以税后收入对食品

支出有显著影响,性别P=0Q61>0.05,接受原假设,所以性别对食品支岀无显者影响。

年龄

女性食品支出

女性税后收入

男性食品支出

男性税后收入

<25

1983

11557

2230

11589

25-34

2987

29387

3757

33328

3544

2993

31463

3821

36151

45-54

3156

29554

3291

35448

55-64

2706

25137

3429

32988

>65

2217

14952

2533

20437

2、考察1990年前后的中国居民的总储蓄■收入关系是否已发生变化。

下表中给

出了中国1979〜2001年以城乡储蓄存款余额代表的居民储蓄以及以GNP代表的居民收入的数据。

为年前

储蓄

GNP

90年后

储蓄

GNP

1979

281

4038.2

1991

9107

21662.5

1930

399.5

4517.8

1992

11545.4

26651.9

1931

523.7

4860.3

1993

14762.4

34560.5

1932

675.4

5301.8

1994

21518.8

46670.0

1933

892.5

5957.4

1995

29662.3

07494.9

1934

1214.7

7206.7

1996

38520.8

66850.5

1935

1622.6

8939.1

1997

46279.8

73142.7

1A6

2237.6

10201.4

1998

53407.5

76967.2

1937

3073.3

11954.5

1999

59621.8

80579.4

1938

3801.O

14922.3

2000

64332.4

88228.1

1939

5146.9

16917.8

2001

73762.4

94346.4

1990

7034.2

18598.4

(1)不考虑时间变量的影响建立回归模型。

模型汇总

模型

R

R方

调整R方

标准估计的误差

1

.9860

.972

.970

5413.22314

a•预测变量:

(常量),储蓄。

b.

Anova0

模型

平方和

df

均方

F

Sig.

回归

.581

1

.581

717.603

.000°

1

残差

615362679.617

21

29302984.744

总计

.198

22

a•因变量:

GNP

b•预测变量:

(常量),储蓄。

系数。

模型

非标准化系数

标准系数

t

Sig.

B

标准误差

试用版

1

(常量)

8814.745

1467.565

6.006

.000

储蓄

1.286

.048

.986

26.788

.000

a•因变量:

GNP

通过上述建立的回归模型统计分析,我们可以得到:

F分布值P二OvO.05,所

以拒绝原假设,所以说明储蓄和收入之间关系没有发生变化。

⑵弓I进时间变量,建立回归模型

模型汇总b

模型

R

R方

调整R方

标准估计的误差

1

.993°

.986

.984

3921.19231

a•预测变量:

(常量),是否90,储蓄。

b.因变量:

GNP

Anovaa

模型

平方和

df

均方

F

Sig.

回归

.151

2

.076

693.812

.000°

1

残差

307514983.047

20

15375749.152

总计

.198

22

a•因变量:

GNP

b•预测变量:

(常量),是否90,储蓄。

系数。

模型

非标准化系数

标准系数

t

Sig.

B

标准误差

试用版

(常量)

6991.461

1138.483

6.141

.000

1

储蓄

1.099

.054

.843

20.232

.000

是否90

11442.578

2557.255

.186

4.475

.000

a•因变量:

GNP

残整统计彳。

极小值

极大值

均值

标准偏差

N

预测值

7300.2998

99504.0703

33939.9913

31141.71765

23

残差

■6780.76807

6459.91992

.00000

3738.71018

23

标准预测值

-.855

2.105

.000

1.000

23

标准残差

-1.729

1.647

.000

.953

23

a•因变量:

GNP

通过上述建立的回归模型统计分析,我们可以得到:

F分布值P二OOQ5,所

以拒绝原假设,所以说明90年前后储蓄和收入之间关系没有发生变化。

Logistic回归分析练习题

研究问题

在一次关于某城镇居民上下班使用交通工具的社会调查中,因变量y=l表示居民主要乘坐公共汽车上下班;y二0表示主要骑自行车上下班;自变量xl表示被调查者的年龄;x2表示被调查者的月收入;x3表示被调查者的性别(x3=l为男性,x3=0为女性)。

表1使用交通工具上下班情况

序号

XI

X2(月收入:

元)

X3

Y

1

18

850

0

0

2

21

1200

0

0

3

23

850

0

1

4

23

950

0

1

5

28

1200

0

1

6

31

850

0

0

7

36

1500

0

1

8

42

1000

0

1

9

46

950

0

1

10

48

1200

0

0

11

55

1800

0

1

12

56

2100

0

1

13

58

1800

0

1

14

18

850

1

0

15

20

1000

1

0

16

25

1200

1

0

17

27

1300

1

0

18

28

1500

1

0

19

30

950

1

1

20

32

1000

1

0

21

33

1800

1

0

22

33

1000

1

0

23

38

1200

1

0

24

41

1500

1

0

25

45

1800

1

1

26

48

1000

1

0

27

52

1500

1

1

28

56

1800

1

1

要求:

(1)模型拟合情况说明。

(包括拟合优度、整个模型的统计学意义)

分类变量编码

频率

参数编码⑴

女性性

13

1.000

男性

15

.000

分类表db

己观测

已预测

上下班方式

百分比校正

主要骑自行车

主要乘坐公交汽车

主要骑自行车

15

0

100.0

上下班方式

.0

♦F八

主要乘坐公交汽车

13

0

步骤0

总计百分比

53.6

a•模型中包括常量。

b・切割值为.500

模型汇总

步骤

-2对数似然值

Cox&SnellR

NagelkerkeR方

1

25.971°

.365

.487

a因为参数估计的更改范围小于.001,所以估计在迭代次数5处终止。

=Hosmer和Lemeshow检验=

步骤

卡方

df

Sig.

1

11.513

7

.118

从Hosmer和Lemeshow检验表中,可以看出:

经过1次迭代后,卡方统

计量为:

11.513,从SIG角度来看:

0.118>0.05,说明模型能够很好的拟合整

体,不存在显著的差异。

(2)各自变量的显著性情况。

方程中的变量

B

S.E,

Wais

df

Sig.

步骤0常量-.143

.379

.143

1

.706

.867|

 

 

不在方程中的变量

得分

df

Sig.

XI

6.038

1

.014

步骤0

变量X2

2.946

1

.086

X3(l)

5.073

1

.024

总统计量

10.414

3

.015

 

模型系数的综合检验

卡方

df

Sig.

步骤

12.703

3

.005

步骤1块

12.703

3

.005

模型

12.703

3

.005

 

分类铲

已观测

已预测

上下班方式

百分比校正

主要骑自行车

卜浚乘坐公交汽车

主要骑自行车上下班方式

主要乘坐公交汽车

步骤1

总计百分比

13

3

2

10

86.7

76.9

82.1

a•切割值为.500

通过上述模型分析我们可以得到:

XI(年龄)P=0.014<0.05,所以拒绝原假设,则年龄与上下班关系具有显著性。

X2(月收入)P二0.086>0・05,所以接受原假设,则月收入与上下班关系不具有显著性。

X3(性别)P二0.024<0Q5,所以拒绝原假设,则年龄与上下班关系具有显著性。

(3)自变量中有显著性的变量对因变量的影响程度,即优势比的意义。

方程中的变M

B

S.E,

Wais

df

Sig.

Exp(B)

EXP(B)的95%C・L

下限

上限

XI

.082

.052

2.486

1

.115

1.086

.980

1.202

X2

.002

.002

.661

1

.416

1.002

.998

1.005

步骤1°X3

(1)

2.502

1.158

4.669

1

.03)

12.205

1.262

118.052

常量

-6.157

2.687

5.251

1

.022

.002

a・在步骤1中输入的变量:

XLX2,X3・

通过上述Logistic回归模型分析,对上下班有显著性影响的是XI(年龄)和

X3(性别),从方程中的变•这个表格我们可以很清晰的得到:

X3(性别)相比XI(年龄)更具有显著性影响。

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 法律文书

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2