相关分析PPT课件.ppt

上传人:b**** 文档编号:18434659 上传时间:2023-08-18 格式:PPT 页数:79 大小:893KB
下载 相关 举报
相关分析PPT课件.ppt_第1页
第1页 / 共79页
相关分析PPT课件.ppt_第2页
第2页 / 共79页
相关分析PPT课件.ppt_第3页
第3页 / 共79页
相关分析PPT课件.ppt_第4页
第4页 / 共79页
相关分析PPT课件.ppt_第5页
第5页 / 共79页
相关分析PPT课件.ppt_第6页
第6页 / 共79页
相关分析PPT课件.ppt_第7页
第7页 / 共79页
相关分析PPT课件.ppt_第8页
第8页 / 共79页
相关分析PPT课件.ppt_第9页
第9页 / 共79页
相关分析PPT课件.ppt_第10页
第10页 / 共79页
相关分析PPT课件.ppt_第11页
第11页 / 共79页
相关分析PPT课件.ppt_第12页
第12页 / 共79页
相关分析PPT课件.ppt_第13页
第13页 / 共79页
相关分析PPT课件.ppt_第14页
第14页 / 共79页
相关分析PPT课件.ppt_第15页
第15页 / 共79页
相关分析PPT课件.ppt_第16页
第16页 / 共79页
相关分析PPT课件.ppt_第17页
第17页 / 共79页
相关分析PPT课件.ppt_第18页
第18页 / 共79页
相关分析PPT课件.ppt_第19页
第19页 / 共79页
相关分析PPT课件.ppt_第20页
第20页 / 共79页
亲,该文档总共79页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

相关分析PPT课件.ppt

《相关分析PPT课件.ppt》由会员分享,可在线阅读,更多相关《相关分析PPT课件.ppt(79页珍藏版)》请在冰点文库上搜索。

相关分析PPT课件.ppt

1,Linearcorrelation线性相关,两指标间的直线相关,柏建岭,DepartmentofEpidemiology&Biostatistics,SchoolofPublicHealthNanjingMedicalUniversity,2,直线相关分析(linearcorrelationanalysis),问题的提出theRelationship确定性关系与相关关系相关关系散点图Pearson相关系数相关系数的计算相关系数的性质相关关系示意图相关系数的含义相关系数的假设检验总体相关系数的区间估计相关分析的正确应用,3,1.问题的提出,以往方法的局限仅限于考察一个观察指标,4,问题的提出,人的体重往往随着身高的增加而增加。

二者之间是否存在某种关联?

如果存在,可否用身高来推测体重的多少?

儿童所能发出的最长音调往往和年龄有关。

同样,是否可以建立年龄和音调长度的数量关系?

人的肺活量往往随着胸围的增加而增加。

举重运动员所能举起的最大重量是否与他的体重有关?

5,联系与相互影响是普遍的现象,6,2确定性关系与相关关系,7,2确定性关系与相关关系,8,2确定性关系与相关关系,确定性的函数关系:

两变量间的函数关系。

随机性的相关关系:

两变量在宏观上存在关系,但并未精确到可以用函数关系来表达。

圆的周长与半径的关系:

C2R速度、时间与路程的关系:

LST,青少年身高与年龄的关系;体重与体表面积的关系;,9,相关关系与确定性关系

(2),当对事物的规律了解加深时,相关关系可以转变为确定性关系。

父亲患白化病X,(X=是,否);子女患白化病Y,(Y=是,否);X与Y的关系不确定。

当母亲患白化病时,X与Y的关系确定:

X=是,则Y=是;X=否,则Y=否。

(父亲为异常基因的携带者出外。

),10,3相关关系,当一个变量增大,另一个也随之增大(或减少),我们称这种现象为共变,或相关(correlation)。

两个变量有共变现象,称为有相关关系。

11,若两个变量同时增加或减少,变化趋势是同向的,则两变量之间的关系为正相关(positivecorrelation);若一个变量增加时,另一个变量减少,变化趋势是反向的,则称为负相关(negativecorrelation)。

3相关关系,12,直线相关(linearcorrelation),又称简单相关,用以描述两个呈正态分布的变量之间的线性共变关系,常简称为相关。

直线相关的概念,13,4Scatterplot(orscatterdiagram)isagraphinwhichthepaired(x,y)sampledataareplottedwithahorizontalxaxisandaverticalyaxis.Eachindividual(x,y)pairisplottedasasinglepoint.,散点图(Scatterplot)在平面直角坐标系上标识两变量(x,y)间关系的统计图。

14,例10名3岁男童体重与体表面积的关系,编号体重(X,kg)体表面积(Y,103cm2)111.05.283211.85.299312.05.358412.35.292513.15.602613.76.014714.45.830814.96.102915.26.0751016.06.411合计134.457.266,15,10名3岁男童体重与体表面积散点图,体重(kg),X,体表面积Y(103cm2),16,散点图的特点,总的趋势:

体表面积随体重的增加而增加。

总的趋势:

直线,无弯曲度。

部分观察点的分布有时并不反映这个总趋势,甚至和总趋势相背离。

绝大部分散点分布在一条不太宽的倾斜的“带状”区域内,17,反映两定量指标间的相关关系用Pearson相关系数,r。

(Pearsoncorrelationcoefficient)用以说明具有直线关系的两个变量间相关关系的密切程度和相关方向的指标.,5Pearson相关系数,18,5Pearson相关系数,X的离均差平方和:

Y的离均差平方和:

X与Y间的离均差积和:

19,以下资料选自Galton的一项研究,目的是探讨成年时身高是否与两岁时的身高(单位:

英寸)有关。

6相关系数的计算,20,6相关系数的计算,21,6相关系数的计算,22,例10名3岁男童体重与体表面积的关系,编号体重(X,kg)体表面积(Y,103cm2)111.05.283211.85.299312.05.358412.35.292513.15.602613.76.014714.45.830814.96.102915.26.0751016.06.411合计133.457.266,23,相关系数的计算,24,7相关系数的性质,-1r1r0为正相关r0为负相关r0为零相关或无相关相关系数绝对值越大,两变量间相关程度越密切;相关系数越接近于0,表示相关越不密切。

25,8相关关系示意图,26,r=-1,-1r0,r=0,直线相关的图示与相关系数的关系,0r1,r=1,27,相关系数的正负示意图,体重(kg),X,肺活量Y(L),28,相关系数的大小示意图,r=1,0r1,r=0,29,9相关系数的含义(了解),30,协方差(covariance,COV):

两个变量与其均值离差乘积的平均数,是相互关系的一种度量。

样本协方差:

9相关系数的含义(了解),31,对协方差的理解,协方差为大的正值时,表示强的正相关。

32,对协方差的理解,协方差接近于零时,表示很小或没有线性相关关系。

33,对协方差的理解,协方差为大的负值时,表示强的负相关。

34,对协方差的理解,35,cm,kg,mm,kg,大于,基本结论:

协方差受计量单位影响,从而不能真实反映相关的程度。

36,相关系数:

协方差与两变量标准差乘积的比值,是没有量纲的、标准化的协方差。

协方差,标准差,37,X,Y,10相关系数的假设检验,0,38,H0:

0,体重与体表面积无相关关系;H1:

0,体重与体表面积有相关关系。

=0.05。

t服从自由度为n-2的t分布。

相关系数的假设检验,39,相关系数的假设检验,自由度102,P0.001拒绝H0,接受H1。

可以认为3岁男童体重与体表面积之间有正相关关系。

40,11总体相关系数的区间估计,从相关系数不等于0的总体中抽样,样本相关系数的分布是偏态的。

41,相关系数的抽样分布(=-0.8),42,相关系数的抽样分布(=0),43,相关系数的抽样分布(=0.8),44,R.A.Fisher(1921)的z变换,z近似服从均数为,标准差为的正态分布。

45,相关系数的z值的抽样分布(=-0.8),46,相关系数的z值的抽样分布(=0),47,相关系数的z值的抽样分布(=0.8),48,相关系数的可信区间估计,将r变换为z;根据z服从正态分布,估计z的可信区间;再将z变换回r。

49,相关系数的可信区间估计,Fishers变换rz正态近似Fishers反变换的95CIz的95CI,50,51,定性资料的相关,配对四格表的Pearson点相关系数列联系数(contingencycoefficient),52,四格表的列联系数,甲法乙法abcd-1rn+1,53,例两种方法观察舌象结果的相关性,某中医师采用两种方法观察舌象200例,观察结果如下,试分析两种观察方法的结果有无联系?

甲法乙法84(a)16(b)20(c)80(d),54,列联表的列联系数,Cramr修正列联系数:

R,C分别是列联表的行数和列数。

2是列联表的2检验。

0rC1,55,例两种血型系统的相关性,某人按两种血型系统统计某地6094人的血型分布,结果见表,问两种血型的分布间有无关系?

ABOMN血型血型MNMN合计O4314909021823A3884108001598B4955879502032AB137179325641合计1451166629776094,56,2为列联表的2。

57,列联系数的假设检验,等价于列联表的构成比的假设检验。

58,等级资料的相关(了解),Spearman等级相关将各变量X,Y分别编秩RX,RY;计算RX与RY的Pearson相关;所得结果即为Spearman等级相关rS。

-1rs1,59,例抗白指数与临床疗效的关系,某研究所用野百合治疗白血病,并作抗白血病指数(简称抗白指数)及疗效的分析,问抗白指数与临床疗效间有无关系?

病例号抗白指数X临床疗效Y

(1)

(2)12+23+39+410+511+630735845955+1070+11881290,RX(3)123456789101112,RY(4)99911.511.53336.56.533,60,RX(3)123456789101112,RY(4)99911.511.53336.56.533,rs=-0.6894,等级资料的相关(了解),61,等级相关的假设检验,H0:

S0,抗白指数与疗效无相关关系;H1:

S0,抗白指数与疗效有相关关系。

=0.05。

当n50时,用查“等级相关界值表”;当n50时,用t检验:

t服从自由度为n-2的t分布。

62,资料的假设检验,本例n=12,查界值表,得:

rs(0.05,12)=0.587即,若H0成立,则等级相关系数有95%的可能在(-0.587,0.587)之间。

现rs=-0.6894,故P0.05。

可以认为,抗白指数与疗效有等级相关关系。

63,例母亲文化程度与儿童智商的关系,母亲文化程度儿童智商等级(Y)合计(X)中下中等中上上等小学2281303136初中5723613526454高中或中专1111210517245大专及以上1410722合计9143328053857rs=0.2261,64,大样本时的等级相关检验,本例n=857,大于50,用t检验:

P0.01。

可以认为,母亲文化程度与儿童智商等级间存在相关关系,母亲文化程度越高,儿童智商等级亦高。

65,相关关系不等于因果关系;相关系数只度量变量间的线性关系,因此,弱相关不一定表明变量间没有关系;极端值可能影响相关系数;注意相关关系成立的数据范围;警惕虚假相关。

12相关分析的正确应用,66,定量资料在进行相关分析(Pearson相关)前,需作散点图,从散点图的趋势判断是否可以作线性相关分析;,12相关分析的正确应用,67,某地160名20岁男子身高与体重散点图(双变量正态分布),68,成都市男中小学生12个年龄组的平均身高,69,紫外光对新生小鼠背皮ATP酶阳性的郎格汉斯细胞(LC)照射不同时间的细胞密度(个/mm3),70,某肿瘤病人的生存率,71,大白鼠进食量(X,g)与体重增加(Y,g)的关系,72,免疫球蛋白A(IgA,g)与火箭电泳高度(Y,mm)的关系,73,26名病人的胃液的pH值及尿中亚硝酸盐浓度的散点图,尿中亚硝酸盐的浓度,胃液的pH值,74,建湖县19781985年疟疾逐月发病数,月份,月发病人数,75,我国19401988年间不同月份的男性婴儿死亡率()的季节性分析,男性婴儿死亡率(),月份,76,识别离群值;,P,Q,图10.5离群值对相关的影响,12相关分析的正确应用,77,排除间杂性。

(a),(b),样本甲观察点样本乙观察点,图10.6样本的间杂性对相关性的误导,12相关分析的正确应用,78,谢谢!

个人观点供参考,欢迎讨论!

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > IT计算机 > 电脑基础知识

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2