1、(P0.05)3、独立性检验:、独立性检验:Test for independence,用于检验两个变数是否相关无效假设:两个变数相互独立;不相关;(,用于检验两个变数是否相关无效假设:(P0.05)其他的检验见下文。其他的检验见下文。浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅 2检验是以检验是以2分布为基础的一种假设检验方法,主 要用于分类变量,根据样本数据推断总体的分布与 期望分布是否有显著差异,或推断两个分类变量是 否相关或相互独立。其原假设为:分布为基础的一种假设检验方法,主 要用于分类变量,根据样本数据推断总体的分布与 期望分布是否有显著差异
2、,或推断两个分类变量是 否相关或相互独立。H0:观察频数与期望频数没有差别:观察频数与期望频数没有差别卡方检验基础卡方检验基础浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅首先假设H首先假设H0 0 成立,计算出成立,计算出2 2值,它表示观察值与理论值之间 的偏离程度。根据值,它表示观察值与理论值之间 的偏离程度。根据2 2分布,分布,2 2统计量以及自由度可以确定 在H统计量以及自由度可以确定 在H0 0 成立的情况下获得当前统计量及更极端情况的概率成立的情况下获得当前统计量及更极端情况的概率P P。如果如果P P 很小,说明观察值和理论值偏离程度太大
3、,应当拒 绝原假设,表示比较资料之间有显著性差异;否则就不能 拒绝原假设,尚不能认为样本所代表的实际情况与理论假 设有差别。很小,说明观察值和理论值偏离程度太大,应当拒 绝原假设,表示比较资料之间有显著性差异;卡方检验基础卡方检验基础?2 2检验的基本思想检验的基本思想浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅 2值的计算:值的计算:22()AEE=由英国统计学家由英国统计学家Karl Pearson首次提出,故被 称为首次提出,故被 称为Pearson 2。卡方检验基础卡方检验基础浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统
4、计学教研室沈毅当n比较大时,当n比较大时,2 2 统计量近似服从统计量近似服从k k-1个自由度的-1个自由度的2 2分布。在自由度固定时,每个分布。在自由度固定时,每个2 2值与一个概率值(值与一个概率值(P P 值)相对 应,此概率值即为在H值)相对 应,此概率值即为在H0 0 成立的前提下,出现这样一个样本 或偏离假设总体更远的样本的概率。如果成立的前提下,出现这样一个样本 或偏离假设总体更远的样本的概率。如果P P 值小于或等于 显著性水准,则拒绝H值小于或等于 显著性水准,则拒绝H0 0,接受H,接受H1 1,即观察频数与期望频数不 一致。如果,即观察频数与期望频数不 一致。如果P
5、P 值大于显著性水准,则不拒绝H值大于显著性水准,则不拒绝H0 0,认为观察 频数与期望频数无显著性差异。,认为观察 频数与期望频数无显著性差异。P P 值越小,说明H值越小,说明H0 0 假设正 确的可能性越小;假设正 确的可能性越小;P P 值越大,说明H值越大,说明H0 0 假设正确的可能性越 大。假设正确的可能性越 大。卡方检验基础卡方分布卡方检验基础卡方分布浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅检验某个连续变量的分布是否与某种理论分布一致,如是否符合正态 分布,检验某个连续变量的分布是否与某种理论分布一致,如是否符合正态 分布,Possi
6、on分布等分布等检验某个分类变量各类的出现概率是否等于指定概率检验某个分类变量各类的出现概率是否等于指定概率检验两个分类变量是否相互独立,如吸烟是否与呼吸道疾病有关检验两个分类变量是否相互独立,如吸烟是否与呼吸道疾病有关检验控制某种或某几种分类变量因素的作用之后,另两个分类变量是 否独立,如上例控制年龄、性别之后,吸烟是否与呼吸道疾病有关检验控制某种或某几种分类变量因素的作用之后,另两个分类变量是 否独立,如上例控制年龄、性别之后,吸烟是否与呼吸道疾病有关检验两种方法的结果是否一致,如两种诊断方法对同一批人进行诊 断,其诊断结果是否一致检验两种方法的结果是否一致,如两种诊断方法对同一批人进行诊
7、 断,其诊断结果是否一致卡方检验基础用途卡方检验基础用途浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅例1 例1 某种药物加化疗与单用某种药物治疗的两 种处理方法,观察对某种癌症的疗效,结果见下 表。(数据见某种药物加化疗与单用某种药物治疗的两 种处理方法,观察对某种癌症的疗效,结果见下 表。(数据见cancer.sav)四格表卡方检验四格表卡方检验处理疗效合计有效无效药物加化疗421355单用药物48351合计9016106两种治疗方法的疗效比较两种治疗方法的疗效比较检验两个变量是否存在显著性差异检验两个变量是否存在显著性差异又如模拟值和实际值之间的检验
8、又如模拟值和实际值之间的检验浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅首先建立数据文件,如下。首先建立数据文件,如下。四格表卡方检验四格表卡方检验浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅注意:由于上表给出的不是原始数据,而是频数表数据,应 该进行预处理。注意:四格表卡方检验四格表卡方检验浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅四格表卡方检验四格表卡方检验浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅四格表卡方检验四格表卡方检验浙
9、江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅四格表卡方检验四格表卡方检验浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅四格表卡方检验四格表卡方检验浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅四格表卡方检验四格表卡方检验浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅结果分析结果分析?表示药物加化疗与单用药物治疗某种癌症的疗效比较的行列表,除了观察值以外,还有期望值。四格表卡方检验四格表卡方检验浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医
10、学院流行病与卫生统计学教研室沈毅结果分析结果分析?此为四格表此为四格表2 2检验的结果,检验的结果,2 26.508,P P0.011,差异有显著性意义,即药物加化疗与单用药物治疗癌症的疗效有显著性差异。,差异有显著性意义,即药物加化疗与单用药物治疗癌症的疗效有显著性差异。四格表卡方检验四格表卡方检验浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅连续性校正连续性校正2检验:检验:仅适用于四格表资料,在仅适用于四格表资料,在n40,所有期望频数均大于,所有期望频数均大于1,只有,只有1/5单元 格的期望频数大于单元 格的期望频数大于1小于小于5时;时;Fis
11、her精确概率法:精确概率法:在样本含量在样本含量40或有格子的期望频数或有格子的期望频数40,最小期望频数,最小期望频数5时,结论与时,结论与Pearson 2基本一致;基本一致;?几种卡方检验的比较:四格表卡方检验四格表卡方检验浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅配对卡方检验配对卡方检验在在Pearson卡方检验中,对行列变量的相关性作了检 验,其中的行列变量是一个事物的两个不同属性。实际应用中,还有一种列联表,其中的行列变量反映的 是一个事物的同一属性。卡方检验中,对行列变量的相关性作了检 验,其中的行列变量是一个事物的两个不同属性。例如把
12、每一份标本分为两份,分 别用两种方法进行化验,比较两种化验方法的结果是否有 本质不同;或分别采用甲、乙两种方法对同一批病人进行 检查,比较此两种方法的结果是否有本质不同,此时要用 配对卡方检验。浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅配对卡方检验配对卡方检验配对卡方检验公式:配对卡方检验公式:22()=bcbc+若b+c40,则用公式:若b+c若b+c40,则用公式:若b+c40,则用公式:40,则用公式:22(1)=bcbc+浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅例2 例2 某实验室分别用乳胶凝集法和免
13、疫荧光法对某实验室分别用乳胶凝集法和免疫荧光法对58名 可疑系统性红斑狼疮患者血清中抗核抗体进行测定,结 果见下表,名 可疑系统性红斑狼疮患者血清中抗核抗体进行测定,结 果见下表,问两种方法的检测结果有无差别?(问两种方法的检测结果有无差别?(数据见 数据见 McNemar.sav)免疫荧光法乳胶凝集法合计+11122323335合计134558两种方法的检测结果两种方法的检测结果配对卡方检验配对卡方检验浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅首先建立数据文件,如下。配对卡方检验配对卡方检验浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行
14、病与卫生统计学教研室沈毅配对卡方检验配对卡方检验同理,由于是频数表数据,应该先用weight cases进行预 处理同理,由于是频数表数据,应该先用weight cases进行预 处理。不能忘记 哦!浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅在此选入频数变量即可进 行下一步的分析。在此选入频数变量即可进 行下一步的分析。配对卡方检验配对卡方检验浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅配对卡方检验配对卡方检验浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅配对卡方检验配对卡方
15、检验浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅配对卡方检验配对卡方检验选中进行配对 卡方检验选中进行配对 卡方检验浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅Chi-Square Tests14.154b1.00011.8361.00114.5501.000.000.00013.9101.000.013c58Pearson Chi-SquareContinuity CorrectionaLikelihood RatioFishers Exact TestLinear-by-LinearAssociationMcN
16、emar TestN of Valid CasesValuedfAsymp.Sig.(2-sided)Exact Sig.(2-sided)Exact Sig.(1-sided)Computed only for a 2x2 tablea.0 cells(.0%)have expected count less than 5.The minimum expected count16.b.Binomial distribution used.c.配对卡方检验配对卡方检验结果分析结果分析浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅在Pearson 卡方检验中
17、,对行变量和列变量的相关性作检 验,其中行变量和列变量是一个事物的两个不同属性。在Pearson 卡方检验中,对行变量和列变量的相关性作检 验,其中行变量和列变量是一个事物的两个不同属性。在实际中,还有一种列联表,其行变量和列变量反映的是 一个事物的同一属性的相同水平,只是对该属性各水平的 区分方法不同。其特征是:行的数目和列的数目总是相同 的。如果希望检验这两种区分同一属性的方法给出的结果 是否一致,则不应当使用Pearson 其特征是:如果希望检验这两种区分同一属性的方法给出的结果 是否一致,则不应当使用Pearson 2 2检验,而应该采用 Kappa一致性检验对两种方法一致程度进行评价
18、检验,而应该采用 Kappa一致性检验对两种方法一致程度进行评价。一致性检验一致性检验浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅Symmetric Measures.455.1153.762.00058KappaMeasure of AgreeN of Valid CasesValueAsymp.Std.ErroraApprox.TbApprox.Sig.Not assuming the null hypothesis.a.Using the asymptotic standard error assuming the null hypothesis.
19、b.结果分析结果分析?如果在如果在crosstab过程的过程的 statistics子对话框中勾选上子对话框中勾选上Kappa复选框,则有以下结果:复选框,则有以下结果:一致性检验一致性检验浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅一般认为,当一般认为,当Kappa0.75时,表明两者一致性较好;时,表明两者一致性较好;0.75 Kappa 0.4时,表明一致性一般;时,表明一致性一般;Kappa 0.4时,表明两者一致性较差。时,表明两者一致性较差。一致性检验一致性检验浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈
20、毅注意:Kappa检验会利用列联表的全部信息,而McNemar 检验 只会利用非主对角线单元格上的信息。因此,对于一 致性较好,即绝大多数数据都在主对角线的大样本列 联表,McNemar检验可能会失去实用价值。一致性检验一致性检验浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅两分类变量间关联程度的度量两分类变量间关联程度的度量 2检验可以从定性的角度说明两个变量是否存在关联,当 拒绝原假设时,在统计上有把握认为两个变量存在相关。但接下来的问题是,如果两变量之间存在相关性,它们之 间的关联程度有多大?针对不同的变量类型,在检验可以从定性的角度说明两个变量是否
21、存在关联,当 拒绝原假设时,在统计上有把握认为两个变量存在相关。针对不同的变量类型,在SPSS中可 以计算各种各样的相关指标,而且中可 以计算各种各样的相关指标,而且Crosstabs过程也对此提 供了完整的支持,此处只涉及两分类变量间关联程度的指 标,更系统的相关程度指标见相关与回归一章。过程也对此提 供了完整的支持,此处只涉及两分类变量间关联程度的指 标,更系统的相关程度指标见相关与回归一章。浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅两分类变量间关联程度的度量两分类变量间关联程度的度量相对危险度相对危险度RRRR:是一个概率的比值,指试验组人群反应
22、阳性概率 与对照组人群反应阳性概率的比值。数值为1,表明试验因素与 反应阳性无关联;小于1时,表明试验因素导致反应阳性的发生 率降低;大于1时,表明试验因素导致反应阳性的发生率增加。:优势比优势比OROR:是一个比值的比,是反应阳性人群中试验因素有无的 比例与反应阴性人群中试验因素有无的比例之比。当关注的事件发生概率比较小时(0.1),优势比可作为相对危 险度的近似。浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅两分类变量间关联程度的度量两分类变量间关联程度的度量例例3 某次食物中毒,现想通过调查发现,吃某海产品(某次食物中毒,现想通过调查发现,吃某海产品
23、(food)和食物中毒发生()和食物中毒发生(poison)是否具有相关 性,以及吃了某食物的人是没吃海产品的人的几倍。数据文件见)是否具有相关 性,以及吃了某食物的人是没吃海产品的人的几倍。数据文件见poison.sav。浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅两分类变量间关联程度的度量两分类变量间关联程度的度量浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅两分类变量间关联程度的度量两分类变量间关联程度的度量?分别指定行列变量到Row(s)和Columns中。浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医
24、学院流行病与卫生统计学教研室沈毅选中可得到选中可得到OROR值值两分类变量间关联程度的度量两分类变量间关联程度的度量浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅两分类变量间关联程度的度量两分类变量间关联程度的度量结果分析结果分析?这就是两变量的四格表。food*poison Crosstabulation1030406.433.640.0654609.650.460.0168410016.084.0100.0CountExpected CountCountExpected CountCountExpected CountYesNofoodTotalYes
25、NopoisonTotal浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅Chi-Square Tests4.018b1.0452.9791.0843.9371.047.055.0433.9781.046100Pearson Chi-SquareContinuity CorrectionaLikelihood RatioFishers Exact TestLinear-by-LinearAssociationN of Valid CasesValuedfAsymp.Sig.(2-sided)Exact Sig.(2-sided)Exact Sig.(1-si
26、ded)Computed only for a 2x2 tablea.0 cells(.0%)have expected count less than 5.The minimum expected count is 6.40.b.两分类变量间关联程度的度量两分类变量间关联程度的度量结果分析结果分析?这是卡方检验的结果,说明吃食物与食物中毒相关。浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅两分类变量间关联程度的度量两分类变量间关联程度的度量结果分析结果分析?结果显示,结果显示,OROR3.00,说明吃了该食物者发生食物中毒的可能性是没有吃该食物者的3.0
27、0倍?3.00,说明吃了该食物者发生食物中毒的可能性是没有吃该食物者的3.00倍?Risk Estimate3.000.9929.0682.500.9876.334.833.6841.016100Odds Ratio for food(Yes/No)For cohort poison=YesFor cohort poison=NoN of Valid CasesValueLowerUpper95%Confidence Interval浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅例例4 某研究人员对某研究人员对3家医院的卫生服务情况进行 了调查,现希望分析
28、寻求就诊和性别之间有无 联系。(数据见家医院的卫生服务情况进行 了调查,现希望分析寻求就诊和性别之间有无 联系。(数据见cmh.sav)分层卡方检验分层卡方检验浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅分层卡方检验分层卡方检验?选入分层变量center选入分层变量center浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅分层卡方检验分层卡方检验进行分 层卡方 检验进行分 层卡方 检验浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅Tests of Homogeneity of t
29、he Odds Ratio.8992.638.8992.638Breslow-DayTaronesChi-SquareddfAsymp.Sig.(2-sided)分层卡方检验分层卡方检验?首先给出的是层间差异的检验,结果显示,不同中心间,性别与就诊的联系是相同的。结果分析结果分析浙江大学医学院流行病与卫生统计学教研室沈毅浙江大学医学院流行病与卫生统计学教研室沈毅Tests of Conditional Independence4.7641.0294.2911.038CochransMantel-HaenszelChi-SquareddfAsymp.Sig.(2-sided)分层卡方检验分层卡方检验?分层卡方检验结果,即考虑了分层因素的影响以后,对性别与就诊的检验结果,共给出CMH分层卡方检验结果,即考虑了分层因素的影响以后,对性别与就诊的检验结果,共给出CMH2 2检验和M
copyright@ 2008-2023 冰点文库 网站版权所有
经营许可证编号:鄂ICP备19020893号-2