第七章 相关分析.docx

上传人:b****1 文档编号:2649344 上传时间:2023-05-04 格式:DOCX 页数:16 大小:87.20KB
下载 相关 举报
第七章 相关分析.docx_第1页
第1页 / 共16页
第七章 相关分析.docx_第2页
第2页 / 共16页
第七章 相关分析.docx_第3页
第3页 / 共16页
第七章 相关分析.docx_第4页
第4页 / 共16页
第七章 相关分析.docx_第5页
第5页 / 共16页
第七章 相关分析.docx_第6页
第6页 / 共16页
第七章 相关分析.docx_第7页
第7页 / 共16页
第七章 相关分析.docx_第8页
第8页 / 共16页
第七章 相关分析.docx_第9页
第9页 / 共16页
第七章 相关分析.docx_第10页
第10页 / 共16页
第七章 相关分析.docx_第11页
第11页 / 共16页
第七章 相关分析.docx_第12页
第12页 / 共16页
第七章 相关分析.docx_第13页
第13页 / 共16页
第七章 相关分析.docx_第14页
第14页 / 共16页
第七章 相关分析.docx_第15页
第15页 / 共16页
第七章 相关分析.docx_第16页
第16页 / 共16页
亲,该文档总共16页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

第七章 相关分析.docx

《第七章 相关分析.docx》由会员分享,可在线阅读,更多相关《第七章 相关分析.docx(16页珍藏版)》请在冰点文库上搜索。

第七章 相关分析.docx

第七章相关分析

第七章  相关分析

第一节BivariateCorrelations过程

7.1.1主要功能

7.1.2实例操作

第二节PartialCorrelations过程

7.2.1主要功能

7.2.2实例操作

第三节DistancesCorrelations过程

7.3.1主要功能

7.3.2实例操作

 

    任何事物的存在都不是孤立的,而是相互联系、相互制约的。

在医学领域中,身高与体重、体温与脉搏、年龄与血压等都存在一定的联系。

说明客观事物相互间关系的密切程度并用适当的统计指标表示出来,这个过程就是相关分析。

    值得注意,事物之间有相关,不一定是因果关系,也可能仅是伴随关系。

但如果事物之间有因果关系,则两者必然相关。

    SPSS的相关分析是借助于Statistics菜单的Correlate选项完成的。

 

第一节 Bivariate过程

 

7.1.1 主要功能

    调用此过程可对变量进行相关关系的分析,计算有关的统计指标,以判断变量之间相互关系的密切程度。

调用该过程命令时允许同时输入两变量或两个以上变量,但系统输出的是变量间两两相关的相关系数。

 

7.1.2 实例操作

     [例7-1]某地区10名健康儿童头发和全血中的硒含量(1000ppm)如下,试作发硒与血硒的相关分析。

 

编号

发硒

血硒

1

2

3

4

5

6

7

8

9

10

74

66

88

69

91

73

66

96

58

73

13

10

13

11

16

9

7

14

5

10

 

7.1.2.1  数据准备

    激活数据管理窗口,定义变量名:

发硒为X,血硒为Y,按顺序输入相应数值,建立数据库(图7.1)。

 

 

图7.1  原始数据的输入

 

7.1.2.2  统计分析

    激活Statistics菜单选Correlate中的Bivariate...命令项,弹出BivariateCorrelation对话框(图7.2)。

在对话框左侧的变量列表中选x、y,点击Ø钮使之进入Variables框;再在CorrelationCoefficients框中选择相关系数的类型,共有三种:

Pearson为通常所指的相关系数(r),Kendell’stau-b为非参数资料的相关系数,Spearman为非正态分布资料的Pearson相关系数替代值,本例选用Pearson项;在TestofSignificance框中可选相关系数的单侧(One-tailed)或双侧(Two-tailed)检验,本例选双侧检验。

 

 

图7.2  相关分析对话框

 

    点击Options...钮弹出BivariateCorrelation:

Options对话框(图7.3),可选有关统计项目。

本例要求输出X、Y的均数与标准差以及XY交叉乘积的标准差与协方差,故选Meansandstandarddeviations和Cross-productdeviationsandcovariances项,而后点击Continue钮返回BivariateCorrelation对话框,再点击OK钮即可。

 

 

图7.3  相关分析统计对话框

 

7.1.2.3  结果解释:

在结果输出窗口中将看到如下统计数据:

变量X、Y的例数、均数与标准差,变量X、Y交叉乘积的例数、标准差与协方差;XY两两对应的相关系数及其双侧检验的概率,本例r=0.8715,P=0.001。

 

Variable      Cases         Mean            StdDev

X               10        75.4000          12.2945

Y               10       10.8000           3.3267

 

Variables           Cases    Cross-ProdDev   Variance-Covar

X        Y            10         320.8000          35.6444

 

               X          Y

X            1.0000      .8715

            (   10)    (   10)

            P=.       P=.001

Y             .8715     1.0000

            (   10)    (   10)

            P=.001    P=.

(Coefficient/(Cases)/2-tailedSignificance)

"."isprintedifacoefficientcannotbecomputed

 

 

第二节 Partial过程

 

7.2.1 主要功能

调用此过程可对变量进行偏相关分析。

在偏相关分析中,系统可按用户的要求对两相关变量之外的某一或某些影响相关的其他变量进行控制,输出控制其他变量影响后的相关系数。

 

7.2.2 实例操作

    [例7-2]某地29名13岁男童身高(cm)、体重(kg)和肺活量(ml)的数据如下表,试对该资料作控制体重影响作用的身高与肺活量相关分析。

 

编号

身高(cm)

体重(kg)

肺活量(ml)

编号

身高(cm)

体重(kg)

肺活量(ml)

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

135.1

139.9

163.6

146.5

156.2

156.4

167.8

149.7

145.0

148.5

165.5

135.0

153.3

152.0

160.5

32.0

30.4

46.2

33.5

37.1

35.5

41.5

31.0

33.0

37.2

49.5

27.6

41.0

32.0

47.2

1750

2000

2750

2500

2750

2000

2750

1500

2500

2250

3000

1250

2750

1750

2250

16

17

18

19

20

21

22

23

24

25

26

27

28

29

153.0

147.6

157.5

155.1

160.5

143.0

149.4

160.8

159.0

158.2

150.0

144.5

154.6

156.5

47.2

40.5

43.3

44.7

37.5

31.5

33.9

40.4

38.5

37.5

36.0

34.7

39.5

32.0

1750

2000

2250

2750

2000

1750

2250

2750

2500

2000

1750

2250

2500

1750

 

7.2.2.1  数据准备

    激活数据管理窗口,定义变量名:

身高为height,体重为weight,肺活量为vc,按顺序输入相应数值,建立数据库。

 

7.2.2.2  统计分析

  激活Statistics菜单选Correlate中的Partial...命令项,弹出PartialCorrelations对话框(图7.4)。

现欲在控制体重的影响下对变量身高与肺活量进行偏相关分析,故在对话框左侧的变量列表中选变量height、vc,点击Ø钮使之进入Variables框,选要控制的变量weight,点击Ø钮使之进入Controllingfor框中,在TestofSignificance框中选双侧检验,然后点击OK钮即可。

 

 

图7.4  偏相关分析对话框

 

7.2.2.3  结果解释

    在结果输出窗口中将看到如下统计数据:

控制体重的影响后,身高与肺活量的相关系数为0.0926,经检验P=0.639,故身高与肺活量的线性相关不存在。

(如果不控制体重的影响,则身高与肺活量的相关系数为0.5884,P为0.001。

在有控制的情况下,身高与肺活量的决定系数=r2 =0.00857,而无控制的身高与肺活量决定系数=r2 =0.34621,可见身高与肺活量的相关有33.764%是由体重协同作用而产生的。

 

Controllingfor..    WEIGHT

             HEIGHT         VC

HEIGHT        1.0000      .0926

             (    0)    (   26)

             P=.       P=.639

VC             .0926     1.0000

             (   26)    (    0)

             P=.639    P=.

 

(Coefficient/(D.F.)/2-tailedSignificance)

 

"."isprintedifacoefficientcannotbecomputed

 

 

如果控制变量改为身高,则得如下结果:

体重与肺活量的相关系数为0.5528,经检验P=0.002,故体重与肺活量的线性相关存在。

可见,尽管肺活量与身高和体重均有关系,但如果仅仅研究其中一个变量与肺活量的相关关系时,体重的意义会更大。

 

Controllingfor..    HEIGHT

                  VC     WEIGHT

VC            1.0000      .5528

             (    0)    (   26)

             P=.       P=.002

WEIGHT         .5528     1.0000

             (   26)    (    0)

             P=.002    P=.

 

(Coefficient/(D.F.)/2-tailedSignificance)

 

"."isprintedifacoefficientcannotbecomputed

 

 

第三节 Distances过程

 

7.3.1 主要功能

    调用此过程可对变量内部各观察单位间的数值进行距离相关分析,以考察相互间的接近程度;也可对变量间进行距离相关分析,常用于考察预测值对实际值的拟合优度。

 

7.3.2 实例操作

    [例7-3]某医师对10份标准血红蛋白样品作三次平行检测,结果如下,问检测结果是否一致?

 

样品号

1

2

3

4

5

6

7

8

9

10

第一次

第二次

第三次

12.36

12.40

12.18

12.14

12.20

12.22

12.31

12.28

12.35

12.32

12.25

12.21

12.12

12.22

12.10

12.28

12.34

12.25

12.24

12.31

12.20

12.41

12.30

12.46

12.33

12.22

12.36

12.17

12.24

12.11

 

7.3.2.1  数据准备

    激活数据管理窗口,定义变量名:

第一次测量值为HB1,第二次测量值为HB2,第三次测量值为HB3,输入相应数值即完成。

 

7.3.2.2  统计分析

    激活Statistics菜单选Correlate中的Distance...命令项,弹出Distance对话框(图7.5)。

在对话框左侧的变量列表中选变量hb1、hb2、hb3,点击Ø钮使之进入Variables框。

在ComputeDistances框中有两个选项,Betweencases表示作变量内部观察值之间的距离相关分析,Betweenvariables表示作变量之间的距离相关分析,在本例中,因三次平行测量结果分别置于三个变量中,故选择后者。

 

 

图7.5  距离相关分析对话框

 

    在Measure栏中有两种测距方式:

Dissimilarities为不相似性测距,Similarities为相似性测距。

若选Dissimilarties并点击Measure...钮,弹出Distance:

DissimilarityMeasure对话框(图7.6),用户可根据数据特征选用测距方法:

   

 

图7.6  距离相关中不相似性距离测量对话框

 

    1、计量资料

    Euclideandistance:

以两变量差值平方和的平方根为距离;

    SquaredEuclideandistance:

以两变量差值平方和为距离;

Chebychev:

以两变量绝对差值的最大值为距离;

    Block:

以两变量绝对差值之和为距离;

    Minkowski:

以两变量绝对差值p次幂之和的p次根为距离;

    Customized:

以两变量绝对差值p次幂之和的r次根为距离。

    2、计数资料

    Chi-squaremeasure:

χ2值测距;

    Phi-squaremeasure:

ψ2值测距,即将χ2测距值除合计频数的平方根。

    3、二分字符变量

    Euclideandistance:

二分差平方和的平方根,最小为0,最大无限;

    SquaredEuclideandistance:

二分差平方和,最小为0,最大无限;

    Sizedifference:

最小距离为0,最大无限;

    Patterndifference:

从0至1的无级测距;

    Variance:

以方差为距,最小为0,最大无限;

    LanceandWilliams:

Bray-Curtis非等距系数,界于0至1之间。

    若选Similarties并点击Measure...钮,弹出Distance:

SimilarityMeasure对话框(图7.7),用户可根据数据特征选用测距方法:

 

 

图7.7  距离相关中相似性距离测量对话框

   

    1、计量资料

    Pearsoncorrelation:

以Pearson相关系数为距离;

    Cosine:

以变量矢量的余弦值为距离,界于-1至+1之间。

    2、二分字符变量

    RussellandRao:

以二分点乘积为配对系数;

    Simplematching:

以配对数与总对数的比例为配对系数;

    Jaccard:

相似比例,分子与分母中的配对数与非配对数给予相同的权重;

    Dice:

Dice配对系数,分子与分母中的配对数给予加倍的权重;

    RogersandTanimoto:

RogersandTanimoto配对系数,分母为配对数,分子为非配对数,非配对数给予加倍的权重;

    SokalandSneath1:

SokalandSneath Ⅰ型配对系数,分母为配对数,分子为非配对数,配对数给予加倍的权重;

    SokalandSneath2:

SokalandSneath Ⅱ型配对系数,分子与分母均为非配对数,但分子给予加倍的权重;

    SokalandSneath3:

SokalandSneath Ⅲ型配对系数,分母为配对数,分子为非配对数,分子与分母的权重相同;

    Kulczynski1:

Kulczynski Ⅰ型配对系数,分母为总数与配对数之差,分子为非配对数,分子与分母的权重相同;

    Kulczynski2:

Kulczynski平均条件概率;

    SokalandSneath4:

SokalandSneath条件概率;

    Hamann:

Hamann概率;

    Lambda:

Goodman-Kruskai相似测量的λ值;

    Anderberg'sD:

以一个变量状态预测另一个变量状态;

    Yule'sY:

Yule综合系数,属于2×2四格表的列联比例函数;

    Yule'sQ:

Goodman-Kruskal γ值,属于2×2四格表的列联比例函数。

    3、其他型变量

    Ochiai:

Ochiai二分余弦测量;

    SokalandSneath5:

SokalandSneath Ⅴ型相似测量;

    Phi4pointcorrelation:

Pearson相关系数的平方值;

    Dispersion:

Dispersion相似测量。

    同时,还可以选择数据转换形式:

    None:

不作数据转换;

    Z-Scores:

作标准Z分值转换;

    Range-1to1:

作-1至+1之间的标准化转换;

    Range0to1:

作0至1之间的标准化转换;

    Maximummagnitudeof1:

作最大量值1的标准转换;

    Meanof1:

作均数单位转换;

    Standarddeviationof1:

作标准差单位转换。

    本例选Similarties项,并以Pearsoncorrelation为测量距离。

点击Continue钮返回Distance对话框,再点击OK钮即可。

 

7.3.2.3  结果解释

在结果输出窗口可看到三次测量结果的相关系数矩阵。

第一次测量与第二次测量结果的r=0.5734,第一次测量与第三次测量结果的r=0.7309,第二次测量与第三次测量结果的r=0.0878,由此可见,后两次测量的结果一致性较差,这意味着第一次恰好是后两次的“均值”,故对该指标作重复测量意义不大。

 

DataInformation

         10unweightedcasesaccepted.

          0casesrejectedbecauseofmissingvalue.

 

 Correlationmeasureused.

 

 CorrelationSimilarityCoefficientMatrix

 

 Variable       HB1           HB2

 HB2           .5734

 HB3           .7309         .0878

 

 

     如果对变量内部各观察值间的一致性进行考核(假定本例HB1变量中的数据为对一个标准试样的十次平行测定),那么需在Distance对话框中选Betweencases项,并选Dissimilarities项的Euclideandistance测距方法,运算结果如下:

     在不相似性测量系数矩阵中,最大值为第五个观察值与第八个观察值间的仅为0.2900,其余的值均较之更小,最小的为第三个观察值与第四个观察值间的仅为0.0100,可见观察值间的不相似性差(不相似性系数愈接近1,不相似性愈好;不相似性系数愈接近0,不相似性愈差),则意味着测定结果的一致性好。

 

DataInformation

         10unweightedcasesaccepted.

          0casesrejectedbecauseofmissingvalue.

 

 Euclideanmeasureused.

 

 EuclideanDissimilarityCoefficientMatrix

           Case1  Case2  Case3  Case4  Case5  Case6  Case7  Case8  Case9

Case2    .2200

Case3    .0500   .1700

Case4    .0400   .1800   .0100

Case5    .2400   .0200   .1900   .2000

Case6    .0800   .1400   .0300   .0400   .1600

Case7    .1200   .1000   .0700   .0800   .1200   .0400

Case8    .0500   .2700   .1000   .0900   .2900   .1300   .1700

Case9    .0300   .1900   .0200   .0100   .2100   .0500   .0900   .0800

Case10    .1900   .0300   .1400   .1500   .0500   .1100   .0700   .2400   .1600

 

 

 

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 人文社科 > 法律资料

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2