SPSS软件分析7回归分析作业.docx

上传人:b****0 文档编号:9421414 上传时间:2023-05-19 格式:DOCX 页数:33 大小:392.52KB
下载 相关 举报
SPSS软件分析7回归分析作业.docx_第1页
第1页 / 共33页
SPSS软件分析7回归分析作业.docx_第2页
第2页 / 共33页
SPSS软件分析7回归分析作业.docx_第3页
第3页 / 共33页
SPSS软件分析7回归分析作业.docx_第4页
第4页 / 共33页
SPSS软件分析7回归分析作业.docx_第5页
第5页 / 共33页
SPSS软件分析7回归分析作业.docx_第6页
第6页 / 共33页
SPSS软件分析7回归分析作业.docx_第7页
第7页 / 共33页
SPSS软件分析7回归分析作业.docx_第8页
第8页 / 共33页
SPSS软件分析7回归分析作业.docx_第9页
第9页 / 共33页
SPSS软件分析7回归分析作业.docx_第10页
第10页 / 共33页
SPSS软件分析7回归分析作业.docx_第11页
第11页 / 共33页
SPSS软件分析7回归分析作业.docx_第12页
第12页 / 共33页
SPSS软件分析7回归分析作业.docx_第13页
第13页 / 共33页
SPSS软件分析7回归分析作业.docx_第14页
第14页 / 共33页
SPSS软件分析7回归分析作业.docx_第15页
第15页 / 共33页
SPSS软件分析7回归分析作业.docx_第16页
第16页 / 共33页
SPSS软件分析7回归分析作业.docx_第17页
第17页 / 共33页
SPSS软件分析7回归分析作业.docx_第18页
第18页 / 共33页
SPSS软件分析7回归分析作业.docx_第19页
第19页 / 共33页
SPSS软件分析7回归分析作业.docx_第20页
第20页 / 共33页
亲,该文档总共33页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

SPSS软件分析7回归分析作业.docx

《SPSS软件分析7回归分析作业.docx》由会员分享,可在线阅读,更多相关《SPSS软件分析7回归分析作业.docx(33页珍藏版)》请在冰点文库上搜索。

SPSS软件分析7回归分析作业.docx

SPSS软件分析7回归分析作业

实验七SPSS线性回归分析

1*统计**班邵***201******

6、为考察某种维尼纤维的耐水性能,安排了一组试验。

测得其甲醇浓度

及相应的“缩醇化度”

的数据如下

x

18202224262830

y

26.8628.3528.7528.8729.7530.0030.36

(1)作散点图

(2)求样本相关系数,并作相应的假设检验,最后说明两个变量的相关性

(3)建立一元线性回归方程,给出具体回归方程。

(4)对建立的回归方程必要的统计检验和残差分析

1,

散点图

此散点图横坐标为缩醇化度,纵坐标为甲醇浓度,数据点基本在一条直线周围波动,可以假定认为此数据基本上服从一元线性,为下面分析做好基础。

2,

相关性

甲醇浓度

缩醇化度

甲醇浓度

Pearson相关性

1

.902**

显著性(双侧)

.005

平方与叉积的和

112.000

17.600

协方差

18.667

2.933

N

7

7

缩醇化度

Pearson相关性

.902**

1

显著性(双侧)

.005

平方与叉积的和

17.600

3.396

协方差

2.933

.566

N

7

7

**.在.01水平(双侧)上显著相关。

相关性检验-Pearson简单相关系数

原假设:

认为甲醇浓度和缩醇化度不存在线性关系。

从表中可知,甲醇浓度和缩醇化度的简单相关系数是0.902。

他们的相关系数检验的P值为0.005,因此,给定显著性水平为0.05或0.01时,都应该拒绝原假设,认为两总体存在线性关系。

相关系数旁两个(**)是说明这两个变量的相关性很强。

总之,甲醇浓度和缩醇化度从在极强的正的线性相关性。

3,

模型

非标准化系数

标准系数

t

Sig.

B

标准误差

试用版

容差

VIF

1

(常量)

25.506

.816

31.248

.000

甲醇浓度

.157

.034

.902

4.684

.005

1.000

1.000

建立一元线性模型

Y=A+BX

原假设:

变量甲醇浓度的偏回归系数与0无显著差异。

此表各数列数据项的含义依次为:

偏回归系数,对应的概率P值,偏回归系数的标准误,标准化的偏回归系数,回归系数显著性检验中T的观测值,对应的概率p值,解释变量的容忍度和方差膨胀因子。

依据该表可以进行回归系数显著性检验,写出回归方程

Y=25.506+0.157X

该表还可以检验相关系数的显著性,甲醇浓度的P值为0.005,在显著水平为0.05或0.01下,都应拒绝原假设,认为变量甲醇浓度的偏回归系数与0有显著差异。

就是说,甲醇浓度和缩醇化度从在极强的正的线性相关性。

4,

描述性统计量

均值

标准偏差

N

缩醇化度

29.2771

.75232

7

甲醇浓度

24.0000

4.32049

7

此表为;两个变量的基本统计量,第二列为两变量的均值,第三列为标准误,第四列为变量的个数。

模型

R

R方

调整R方

标准估计的误差

1

.902a

.814

.777

.35503

拟合优度检验-R方变化

依据该表做拟合优度检验,由于该方程只有一个解释变量,调整后的R方明显变小了,我们可以参考R方,由于R方(0.814)接近于1,一次认为拟合优度较好,被解释变量可以被模型解释的部分较多,未能被解释的变量较少。

Anovaa

模型

平方和

df

均方

F

Sig.

1

回归

2.766

1

2.766

21.942

.005b

残差

.630

5

.126

总计

3.396

6

a.因变量:

缩醇化度

b.预测变量:

(常量),甲醇浓度。

回归方程显著性检验

原假设:

变量甲醇浓度的偏回归系数与0无显著差异。

从表中可知,被解释变量的总离差平方和为3.396,回归平方和及均方为2.766,2.766,残差平方和及均方为0.630,0.126,F检验统计量的观测值为21.942,对应p值为0.005,给定显著水平0.05,P小于显著水平,因此拒绝原假设,认为变量甲醇浓度的偏回归系数与0无显著差异。

就是说,甲醇浓度和缩醇化度从在极强的正的线性相关性。

残差分析

残差数据点围绕金准先还存在一定的规律性,但我们发现标准换的残差和标准正态分布不存在显著差异,可以认为残差满足线性模型的前提条件。

单样本Kolmogorov-Smirnov检验

StandardizedResidual

N

16

正态参数a,b

均值

.0000000

标准差

.96609178

最极端差别

绝对值

.114

.114

-.114

Kolmogorov-SmirnovZ

.457

渐近显著性(双侧)

.985

a.检验分布为正态分布。

b.根据数据计算得到。

原假设H0:

该总体与正态总体分布无显著差异。

备择假设H1:

该总体与正态总体分布有显著差异。

通过进行非参数检验,可以得出渐进显著性(双侧)为0.985,在显著水平α=0.05下,这可以认为标准化残差与标准正态分布无显著差异,可以认为残差满足了线性模型的前提条件。

7、测得一组弹簧形变

(单位:

cm)和相应的外力

(单位:

N)数据如下:

y

11.21.41.61.82.02.22.42.83.0

x

3.083.764.315.025.516.256.747.408.549.24

由胡克定律知

,试估计

,并在

试给出相应的外力

的0.95预测区间。

模型汇总c,d

模型

R

R方b

调整R方

标准估计的误差

1

.989a

.978

.975

.10516

a.预测变量:

弹簧形变

b.对于通过原点的回归(无截距模型),R方可测量(由回归解释的)原点附近的因变量中的可变性比例。

对于包含截距的模型,不能将此与R方相比较。

c.因变量:

相应外力

d.通过原点的线性回归

拟合优度检验-R方变化

依据该表做拟合优度检验,由于该方程只有一个解释变量,由于R方(0.975)接近于1,一次认为拟合优度较好,被解释变量可以被模型解释的部分较多,未能被解释的变量较少。

Anovab

模型

平方和

df

均方

F

Sig.

1

回归

3.916

1

3.916

354.091

.000a

残差

.088

8

.011

总计

4.004

9

a.预测变量:

(常量),弹簧形变。

b.因变量:

相应外力

回归方程显著性检验

原假设:

变量弹簧形变的偏回归系数与0无显著差异。

从表中可知,被解释变量的总离差平方和为4.004,回归平方和及均方为3.916,3.916,残差平方和及均方为0.088,0.011,F检验统计量的观测值为354.091,对应p值为0.000,给定显著水平0.05,P小于显著水平,因此拒绝原假设,认为变量弹簧形变的偏回归系数与0无显著差异。

就是说,弹簧形变和相应外力从在极强的正的线性相关性。

模型

非标准化系数

标准系数

t

Sig.

B的95.0%置信区间

B

标准误差

试用版

下限

上限

1

(常量)

.129

.102

1.272

.239

-.105

.364

弹簧形变

.308

.016

.989

18.817

.000

.270

.345

建立模型

Y=kX

原假设:

变量弹簧形变的偏回归系数与0无显著差异。

依据该表可以进行回归系数显著性检验,写出回归方程

Y=0.308X

该表还可以检验相关系数的显著性,弹簧形变的P值为0.000,在显著水平为0.05或0.01下,都应拒绝原假设,认为变量弹簧形变的偏回归系数与0有显著差异。

就是说,弹簧形变和相应外力从在极强的正的线性相关性。

在x=2.6cm时,y=0.308*2.6=0.86528,且y在x=2.6cm的95%的预测区间为:

(0.78866,0.88257)。

8、某医师测得10名3岁儿童的身高(cm)、体重(kg)和体表面积(cm2)资料如下。

(1)画出以身高、体重为自变量,体表面积为应变量的散点图。

(2)试用多元回归方法确定以身高、体重为自变量,体表面积为应变量的多元线形回归方程。

(3)对建立的回归方程作各种相关的统计检验、残差分析、多重共线性分析

(4)如需要修正,请提供修正后的线性模型。

1,

散点图

左图为散点图横坐标为身高,纵坐标为体表面积,数据点基本在一条直线周围波动,可以假定认为此数据基本上服从一元线性,为下面分析做好基础。

右图为散点图横坐标为体重,纵坐标为体表面积,数据点基本在一条直线周围波动,可以假定认为此数据基本上服从一元线性,为下面分析做好基础。

2,

系数a

模型

非标准化系数

标准系数

t

Sig.

共线性统计量

B

标准误差

试用版

容差

VIF

1

(常量)

-2.856

6.018

-.475

.649

身高

.069

.075

.215

.919

.389

.256

3.912

体重

.184

.057

.758

3.234

.014

.256

3.912

a.因变量:

体表面积

建立一元线性模型

Y=A+BX+CY

原假设:

变量身高和体重的偏回归系数与0无显著差异。

此表各数列数据项的含义依次为:

偏回归系数,对应的概率P值,偏回归系数的标准误,标准化的偏回归系数,回归系数显著性检验中T的观测值,对应的概率p值,解释变量的容忍度和方差膨胀因子。

依据该表可以进行回归系数显著性检验,写出回归方程

Y=-2.856+0.069X+0.184Y

该表还可以检验相关系数的显著性,身高的P值为0.389,在显著水平为0.05或0.01下,都应不能拒绝原假设,认为身高的偏回归系数与0没有显著差异。

就是说,身高和体表面积没有极强的正的线性相关性。

该表还可以检验相关系数的显著性,体重的P值为0.014,在显著水平为0.05,都应拒绝原假设,认为体重的偏回归系数与0有显著差异。

就是说,体重和体表面积强的正的线性相关性。

3,

描述性统计量

均值

标准偏差

N

体表面积

5.73650

.403441

10

身高

89.130

1.2641

10

体重

13.440

1.6635

10

此表为;两个变量的基本统计量,第二列为两变量的均值,第三列为标准误,第四列为变量的个数。

相关性

体表面积

身高

体重

Pearson相关性

体表面积

1.000

.869

.943

身高

.869

1.000

.863

体重

.943

.863

1.000

Sig.(单侧)

体表面积

.

.001

.000

身高

.001

.

.001

体重

.000

.001

.

N

体表面积

10

10

10

身高

10

10

10

体重

10

10

10

相关性检验-Pearson简单相关系数

原假设:

认为体表面积和身高、体重不存在线性关系。

从表中可知,体表面积和身高简单相关系数是0.869。

他们的相关系数检验的P值为0.001,因此,给定显著性水平为0.05或0.01时,都应该拒绝原假设,认为两总体存在线性关系。

相关系数旁两个(**)是说明这两个变量的相关性很强。

总之,体表面积和身高从在极强的线性相关性。

从表中可知,体表面积和体重简单相关系数是0.943。

他们的相关系数检验的P值为0.000,因此,给定显著性水平为0.05或0.01时,都应该拒绝原假设,认为两总体存在线性关系。

相关系数旁两个(**)是说明这两个变量的相关性很强。

总之,体表面积和体重从在极强的线性相关性。

模型

R

R方

调整R方

标准估计的误差

1

.950a

.902

.874

.143346

拟合优度检验-R方变化

依据该表做拟合优度检验,由于该方程有两个解释变量,调整后的R方跟有说服力,我们可以参考调整R方,由于R方(0.874)接近于1,一次认为拟合优度较好,被解释变量可以被模型解释的部分较多,未能被解释的变量较少。

Anovab

模型

平方和

df

均方

F

Sig.

1

回归

1.321

2

.661

32.145

.000a

残差

.144

7

.021

总计

1.465

9

a.预测变量:

(常量),体重,身高。

b.因变量:

体表面积

回归方程显著性检验

原假设:

变量身高、体重的偏回归系数与0无显著差异。

从表中可知,被解释变量的总离差平方和为1.465,回归平方和及均方为1.321,0.661,残差平方和及均方为0.1440.021,F检验统计量的观测值为32.145,对应p值为0.000,给定显著水平0.05,P小于显著水平,因此拒绝原假设,认为变量身高体重的偏回归系数与0无显著差异。

就是说,身高体重和体表面积从在极强的线性相关性。

可以建立线性模型。

系数a

模型

非标准化系数

标准系数

t

Sig.

共线性统计量

B

标准误差

试用版

容差

VIF

1

(常量)

-2.856

6.018

-.475

.649

身高

.069

.075

.215

.919

.389

.256

3.912

体重

.184

.057

.758

3.234

.014

.256

3.912

a.因变量:

体表面积

原假设:

变量身高和体重的偏回归系数与0无显著差异。

此表各数列数据项的含义依次为:

偏回归系数,对应的概率P值,偏回归系数的标准误,标准化的偏回归系数,回归系数显著性检验中T的观测值,对应的概率p值,解释变量的容忍度和方差膨胀因子。

该表还可以检验相关系数的显著性,身高的P值为0.389,在显著水平为0.05或0.01下,都应不能拒绝原假设,认为身高的偏回归系数与0没有显著差异。

就是说,身高和体表面积没有极强的正的线性相关性。

该表还可以检验相关系数的显著性,体重的P值为0.014,在显著水平为0.05,都应拒绝原假设,认为体重的偏回归系数与0有显著差异。

就是说,体重和体表面积强的正的线性相关性。

由于该模型中保留了一些不应保留的变量,因此该模型目前不可用,应重新建模。

同时,从容忍度和方差膨胀因子看,身高和其他变量存在严重的多重共线性很严重,再重新建模时可以考虑剔除该变量。

共线性诊断a

模型

维数

特征值

条件索引

方差比例

(常量)

身高

体重

1

1

2.992

1.000

.00

.00

.00

2

.008

19.000

.00

.00

.28

3

2.538E-5

343.355

1.00

1.00

.72

a.因变量:

体表面积

采用多重共线性检验

从方差比来看,第3个特征根既能解释身高方差的100%,也解释体重方差的72%,因此有理由认为这些变量间存在多重共线性,再从条件指数来看,第2,3个条件指数都大于10,说明变量间确实存在多重性共线性。

残差分析

残差数据点围绕金准先还存在一定的规律性,但我们发现标准换的残差和标准正态分布不存在显著差异,可以认为残差满足线性模型的前提条件。

残差统计量a

极小值

极大值

均值

标准偏差

N

预测值

5.21050

6.34913

5.73650

.383122

10

标准预测值

-1.373

1.599

.000

1.000

10

预测值的标准误差

.048

.101

.077

.016

10

调整的预测值

5.09660

6.30703

5.73285

.394187

10

残差

-.226087

.204304

.000000

.126420

10

标准残差

-1.577

1.425

.000

.882

10

Student化残差

-1.828

1.543

.009

1.030

10

已删除的残差

-.303838

.285397

.003653

.174195

10

Student化已删除的残差

-2.342

1.759

.004

1.196

10

Mahal。

距离

.122

3.609

1.800

1.061

10

Cook的距离

.001

.527

.125

.180

10

居中杠杆值

.014

.401

.200

.118

10

a.因变量:

体表面积

4,

模型汇总b

模型

R

R方

调整R方

标准估计的误差

更改统计量

Durbin-Watson

R方更改

F更改

df1

df2

Sig.F更改

1

.943a

.890

.876

.141945

.890

64.705

1

8

.000

2.212

a.预测变量:

(常量),体重。

b.因变量:

体表面积

已排除的变量b

模型

BetaIn

t

Sig.

偏相关

共线性统计量

容差

1

身高

.215a

.919

.389

.328

.256

a.模型中的预测变量:

(常量),体重。

b.因变量:

体表面积

逐步刷选策略

由于上面的回归方程荀子啊一些不可忽视的问题,应重新建立回归方程,采用逐步刷选策略让SPSS自动完成解释变量的选择。

观测每一步的检验变化。

逐步刷选策略一步完成,即为最终模型,从方程建立过程来看,随机解释变量减少一个,方程拟合优度下降,同时说明建立回归方程并不是一味的追求高拟合优度为唯一目的。

还要重点考察解释变量是否对被解释变量有贡献。

剔除了身高。

给定显著水平位0.05,可以看到被剔除的变量身高的偏F检验的p值均大于显著性水平,因此均不能拒绝原假设,认为这些偏回归系数与0无显著差异,他们对被解释变量的线性解释没有显著贡献,不应留在方程中。

最终留在方程中的变量为体重,方程的DW检验值为2.212,残差存在一定的正自相关性

Anovab

模型

平方和

df

均方

F

Sig.

1

回归

1.304

1

1.304

64.705

.000a

残差

.161

8

.020

总计

1.465

9

a.预测变量:

(常量),体重。

b.因变量:

体表面积

原假设:

被解释变量与解释变量间的线性关系不显著

给定显著性水平是,0,05,由于方程p值小于的显著水平,拒绝原假设,因此被解释变量与解释变量间的线性关系显著,建立线性模型是恰当的。

系数a

模型

非标准化系数

标准系数

t

Sig.

B的95.0%置信区间

B

标准误差

试用版

下限

上限

1

(常量)

2.661

.385

6.915

.000

1.774

3.549

体重

.229

.028

.943

8.044

.000

.163

.294

a.因变量:

体表面积

建立一元线性模型

Y=A+BX

此表各数列数据项的含义依次为:

偏回归系数,对应的概率P值,偏回归系数的标准误,标准化的偏回归系数,回归系数显著性检验中T的观测值,对应的概率p值,解释变量的容忍度和方差膨胀因子。

依据该表可以进行回归系数显著性检验,写出回归方程

Y=2.661+0.229X

该表还可以检验相关系数的显著性,体重的P值为0.00,在显著水平为0.05,都应拒绝原假设,认为体重的偏回归系数与0有显著差异。

就是说,体重和体表面积强的正的线性相关性。

9、为检验X射线的杀菌作用,用200kV射线照射杀菌,每次照射6min,照射次数为

,照射后所剩细菌数为

,下表是一组试验结果

根据经验知道

关于

的曲线回归方程形如

试给出具体的回归方程,并求其对应的决定系数

和剩余标准差

散点图

此散点图横坐标为照射次数,纵坐标为所剩细菌数,数据点基本在一条曲线周围波动,两变量并非线性,课考虑曲线估计。

为下面分析做好基础。

模型汇总和参数估计值

因变量:

y

方程

模型汇总

参数估计值

R方

F

df1

df2

Sig.

常数

b1

指数

.997

6418.741

1

18

.000

1051.733

-.247

自变量为x。

拟合优度检验-R方变化

依据该表做拟合优度检验,拟合优度为0.997,一次认为拟合优度较好,被解释变量可以被模型解释的部分较多,未能被解释的变量较少。

从下面的你和回归线可以看出,散点几乎都在曲线附近波动。

ANOVA

平方和

df

均方

F

Sig.

回归

40.679

1

40.679

6418.741

.000

残差

.114

18

.006

总计

40.793

19

自变量为照射次数。

回归方程显著性检验

原假设:

照射次数和所剩细菌不存在极强的相关性。

从表中可知,被解释变量的总离差平方和为40.793,回归平方和及均方均为40.679,残差平方和及均方为0.114,0.006,F检验统计量的观测值为6418.741,对应p值为0.00,给定显著水平0.05,P小于显著水平,因此拒绝原假设,认为变量照射次数的偏回归系数与0无显著差异。

就是说,照射次数和所剩细菌存在极强的相关性。

系数

未标准化系数

标准化系数

t

Sig.

B

标准误

Beta

照射次数

-.247

.003

-.999

-80.117

.000

(常数)

1051.733

38.894

27.041

.000

因变量为ln(所剩细菌数)。

建立曲线模型

依据该表可以进行回归系数显著性检验,写出回归方程

Y=1051.733e^(-0.247X)

10、请利用“cars.sav”的数据文件中的连续型变量:

mpg,engine,horse,weight,accel五个变量,自选一个因变量作其余变量的线性回归模型,比如,以accel为因变量。

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > IT计算机 > 电脑基础知识

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2