第十八章病例对照研究实习指导定.docx
《第十八章病例对照研究实习指导定.docx》由会员分享,可在线阅读,更多相关《第十八章病例对照研究实习指导定.docx(20页珍藏版)》请在冰点文库上搜索。
第十八章病例对照研究实习指导定
第十八章病例-对照研究的设计与分析
[教学要求]
了解:
病例-对照研究的设计及需要注意的问题;偏倚的种类与控制方法;病例对照研究的样本含量估计。
熟悉:
成组设计资料优势比的假设检验方法;M-H分层分析方法及其趋势检验方法;1:
1配对设计两分类变量优势比的假设检验方法。
掌握:
掌握成组设计和配对设计资料的优势比的意义、计算和置信区间估计的方法。
[重点难点]
第一节病例-对照研究的基本概念
一、基本概念
病例-对照研究:
属回顾性设计,它根据研究对象目前状态(是否有病)将其分到病例组或对照组,然后回顾性地询问或调查研究对象过去的危险因素接触史。
成组设计:
指从产生病例人群中独立随机抽取有代表性的未患病对照组的设计形式。
匹配设计:
为了消除重要的已知混杂因素对研究结果的影响,按病例的混杂因素水平选择匹配对照的设计形式。
偏倚:
由研究对象的选择、信息收集的过程以及病例组与对照组的部分人群特征的不均衡等造成的倾向性误差。
优势比:
病例组接触某危险因素相对于不接触某危险因素的优势与对照组类似优势的比值。
当疾病发生率较低时,它是相对危险度的近似估计值。
二、计算
样本含量的估计:
分两步,首先用下式估计N’
式中
=对照组例数/病例组例数,
为对照中有暴露史者所占比率的估计值,
;P1为病例中有暴露史者所占比率,
,
OR为对立假设中优势比的数值;
为第Ⅰ类错误概率为
时的标准正态临界值,
为第Ⅱ类错误概率为
时的标准正态临界值。
第二步,计算病例组的样本含量
计算公式为
式中
。
优势比的计算公式:
三、应用
病例-对照研究研究周期短、样本量相对较小,适合罕见疾病病因研究,
并可以在一次研究中同时研究多个致病危险因素,具有省时、省力和省费用的优点。
病例-对照研究的缺点是:
无法直接估计疾病发生频率;难以选择合适的对照组,常常导致严重的偏倚;对因果推断的论证强度较低,特别是无法从时间先后上判断何为因,何为果。
第二节成组设计资料的分析
一、计算
1.四格表资料的分析:
(1)优势比的计算
(2)优势比的假设检验
(3)优势比的区间估计
Miettinen法在χ2检验的基础上计算OR的95%置信区间的上下限,公式为
2.多个四格表的分层分析:
χ
(1)公共优势比ORM-H的估计算公式为
(2)对公共优势比进行假设检验,χ2统计量为
其中
(3)95%置信区间的估计用Miettinen法
(4)趋势检验的统计量
二、应用
成组设计病例-对照研究资料的分析步骤:
(1)整理频数表。
(2)计算优势比。
(3)对优势比做假设检验。
(4)估计优势比的置信区间。
(5)如果危险因素是多水平等级变量变,可以进一步做趋势检验。
(6)如果存在混杂因素,可以用分层分析或后面介绍的多因素logistic回归模型校正混杂因素。
第三节匹配设计资料的分析
一、计算
优势比的估计:
优势比的假设检验:
优势比
的95%置信区间估计用Miettinen法。
二、应用
配对设计病例对照研究资料的分析步骤:
(1)整理频数表。
(2)估计优势比。
(3)对优势比做假设检验。
(4)估计优势比的置信区间。
1:
M或N:
M配伍设计资料、多个水平危险因素的分析和混杂因素的校正用后面介绍的条件logistic回归模型更为方便,这里不要求掌握。
[案例讨论参考答案]
案例18-11.该研究设计是在现况调查的基础上作病例-对照研究资料分析,但该研究没有严格按病例-对照研究进行设计,特别是对照的选择不能代表产生病例的人群,存在严重的偏倚,例如,病例组与对照组的年龄、性别、肥胖和体力劳动可能有明显差别。
2.由于在设计上的缺陷,病例组与对照组在一些重要的混杂因素方面存在不均衡,因此在分析中必须校正这些混杂因素的影响,如性别、年龄、职业或体力劳动史等。
若混杂因素只是一、两个,可以用分层分析方法校正;若混杂因素较多,可采用第19章的logistic回归。
[电脑实验及结果解释]
实验18-1Mantel-Haenszel分层分析
程序18-1Mantel-Haenszel分层分析及说明
行号
程序
说明
01
DATAmh;
建立SAS数据集mh;
02
INPUTfreagedrinkid;
定义并输入变量;
03
CARDS;
04
5110
05
5120
……
20
;
21
PROCFREQ;
调用频数表FREQ过程;
22
TABLEage*id*drink/CHISQCMH;
定义表,要求做χ2检验和分层分析;
23
WEIGHTfre;
指定权重变量;
24
RUN;
运行程序;
运行结果:
Output窗口:
Table1ofidbydrinkTable2ofidbydrink
Controllingforage=1Controllingforage=2
iddrinkiddrink
Frequency|Frequency|
RowPct|1|2|TotalRowPct|1|2|Total
---------+--------+--------+---------+--------+--------+
0|5|5|100|25|21|46
|50.00|50.00||54.35|45.65|
---------+--------+--------+---------+--------+--------+
1|35|270|3051|29|138|167
|11.48|88.52||17.37|82.63|
---------+--------+--------+---------+--------+--------+
Total40275315Total54159213
Table3ofidbydrinkTable4ofidbydrink
Controllingforage=3Controllingforage=4
iddrinkiddrink
Frequency|Frequency|
RowPct|1|2|TotalRowPct|1|2|Total
---------+--------+--------+---------+--------+--------+
0|42|34|760|24|44|68
|55.26|44.74||35.29|64.71|
---------+--------+--------+---------+--------+--------+
1|27|139|1661|18|119|137
|16.27|83.73||13.14|86.86|
---------+--------+--------+---------+--------+--------+
Total69173242Total42163205
以上是四个年龄层的频数表。
SummaryStatisticsforidbydrink
Controllingforage
Cochran-Mantel-HaenszelStatistics(BasedonTableScores)
StatisticAlternativeHypothesisDFValueProb
--------------------------------------------------------------------------------
1NonzeroCorrelation186.5130<.0001
2RowMeanScoresDiffer186.5130<.0001
3GeneralAssociation186.5130<.0001
以上是M-H分层χ2检验结果。
EstimatesoftheCommonRelativeRisk(Row1/Row2)
TypeofStudyMethodValue95%ConfidenceLimits
-------------------------------------------------------------------------------------------------
Case-ControlMantel-Haenszel5.28733.65057.6580
(OddsRatio)Logit5.34803.69497.7406
CohortMantel-Haenszel3.17502.48294.0599
(Col1Risk)Logit3.25332.55904.1359
CohortMantel-Haenszel0.60930.52980.7008
(Col2Risk)Logit0.63880.55870.7305
以上是优势比的估计,选用OR值估计。
Breslow-DayTestfor
HomogeneityoftheOddsRatios
--------------------------------------
Chi-Square1.8676
DF3
Pr>ChiSq0.6003
以上是各层相对危险性的齐性检验,差异没有统计学意义,说明各年龄组吸烟与疾病关联程度相同。
TotalSampleSize=975
实验18-2过度匹配
程序18-2过度匹配电脑实验的SAS程序及说明
行号
程序
说明
01
DATAcase1;
建立SAS数据集case1;
02
DOi=1TO100;
设立循环利用随机数模拟产生匹配设计的数据;
03
no=i;cough=1;smoke1=1;smoke2=1;
设置初始变量,不咳嗽,病例、对照均不吸烟;
04
IFUNIFORM(0)>0.1THENDO;
如果抽中肺癌病例中有咳嗽的90%,则执行下列语句
05
cough=2;
咳嗽指示变量cough赋值为2;
06
IFUNIFORM(0)>0.2THENsmoke1=2;
按80%的吸烟比例抽样,抽中则smoke1=2;
07
IFUNIFORM(0)>0.25THENsmoke2=2;
按对照中75%的吸烟比例抽样,抽中则smoke2=2;
08
OUTPUT;
写入数据集;
09
END;
结束条件语句分支;
10
ELSEDO;
如果属于肺癌病例不咳嗽的10%,则
11
IFUNIFORM(0)>0.55THENsmoke1=2;
按45%的吸烟比例抽样,抽中smoke1=2;
12
IFUNIFORM(0)>0.6THENsmoke2=2;
按对照中40%的吸烟比例抽样,抽中则smoke2=2;
13
OUTPUT;
写入数据集;
14
END;END;
结束条件语句;结束循环;
15
DATAcase2;
建立SAS数据集case2;
16
DOi=1TO100;
设立循环利用随机数模拟产生成组设计的数据;
17
cough=1;smoke=1;id=1;
设置对照的初始变量,不咳嗽、不吸烟;
18
IFUNIFORM(0)>0.9THENDO;
如果抽中对照中咳嗽的10%,则
19
cough=2;
咳嗽指示变量cough赋值为2;
20
IFUNIFORM(0)>0.2THENsmoke=2;
如果抽中咳嗽病例中吸烟的80%部分,则smoke=2;
21
END;
结束条件语句分支;
22
ELSEDO;
如果抽中对照中不咳嗽的90%,则
23
IFUNIFORM(0)>0.55THENsmoke=2;
如果抽中不咳嗽病例中吸烟的45%,则smoke=2;
24
END;
结束条件语句;
25
OUTPUT;
写入数据集;
26
cough=1;smoke=1;id=2;
设置肺癌病例的初始变量,不咳嗽、不吸烟;
27
IFUNIFORM(0)>0.1THENDO;
如果抽中病例中咳嗽的90%,则
28
cough=2;
cough=2;
29
IFUNIFORM(0)>0.25THENsmoke=2;
如果抽中咳嗽对照中吸烟的75%,则smoke=2;
30
END;
结束条件语句分支;
31
ELSEDO;
如果抽中病例中不咳嗽的10%,则
32
IFUNIFORM(0)>0.6THENsmoke=2;
如果抽中不咳嗽对照中吸烟的40%,则smoke=2;
33
END;
结束条件语句;
34
OUTPUT;
写入数据集;
35
END;
结束循环;
36
PROCFREQDATA=case2;
调用频数表过程分析成组设计资料;
37
TABLEid*smoke/NOCOLNOPERCENTCHISQRELRISK;
定义表,要求做χ2检验和相对危险度分析;
38
PROCFREQDATA=case1;
调用频数表过程分析配对设计资料;
39
TABLEsmoke1*smoke2/NOCOLNOPERCENTAGREE;
定义表,要求做McNemar’s检验;
40
PROCFREQDATA=case1;
调用频数表过程分析配对设计资料;
41
TABLEcough*smoke1*smoke2/NOCOLNOPERCENTAGREE;
定义表,要求做McNemar’s检验;
42
RUN;
运行程序;
运行结果:
Output窗口:
Tableofidbysmoke
idsmoke
Frequency|
RowPct|1|2|Total
---------+--------+--------+
1|59|41|100
|59.00|41.00|
---------+--------+--------+
2|28|72|100
|28.00|72.00|
---------+--------+--------+
Total87113200
StatisticsforTableofidbysmoke
StatisticDFValueProb
----------------------------------------------------------------------
Chi-Square119.5504<.0001
LikelihoodRatioChi-Square119.9069<.0001
ContinuityAdj.Chi-Square118.3094<.0001
Mantel-HaenszelChi-Square119.4526<.0001
PhiCoefficient0.3127
ContingencyCoefficient0.2984
Cramer'sV0.3127
成组设计抽样结果显示吸烟与肺癌的关联有统计学意义。
EstimatesoftheRelativeRisk(Row1/Row2)
TypeofStudyValue95%ConfidenceLimits
-----------------------------------------------------------------------------------
Case-Control(OddsRatio)3.70032.04906.6825
Cohort(Col1Risk)2.10711.47863.0028
Cohort(Col2Risk)0.56940.43690.7422
优势比为3.7,为较强的关联。
SampleSize=200
Tableofsmoke1bysmoke2
smoke1smoke2
Frequency|
RowPct|1|2|Total
---------+--------+--------+
1|7|21|28
|25.00|75.00|
---------+--------+--------+
2|18|54|72
|25.00|75.00|
---------+--------+--------+
Total2575100
StatisticsforTableofsmoke1bysmoke2
McNemar'sTest
-----------------------
Statistic(S)0.2308
DF1
Pr>S0.6310
由于过度匹配,未能显示吸烟与肺癌关系有统计学意义,优势比仅为21/18=1.17。
SampleSize=100
[
a)
思考与练习参考答案]
1.
OR=1.727;χ2=12.065,df=1,P=0.001;95%CI=1.268~2,353。
2.趋势检验:
χ2=7.478,df=1,P=0.006,表明随着每日饮酒量增加,发生心肌梗塞的危险性增加。
3.a=Yi;b=(1-Yi);c=Xi;d=(m-Xi);n1=1;n0=m;m1i=(Xi+Yi);
m0i=((1-Yi)+(m-Xi))=(1+m-Xi-Yi);n=(1+m)。
4.
(1)以
和
表示病例和对照,
和
表示暴露和无暴露,
病例与对照暴露的优势比为:
暴露与非暴露患病的优势比为:
(2)Bayes公式为:
用Bayes公式表示暴露患病的优势比为:
(3)当发病率很低时,无论是暴露或非暴露,其不发病的概率近似等于零,即
,这时
。
5.OR=0.354,χ2=20.045,df=1,P<0.001;95%CI=0.225~0.558。
如果用成组设计的分析方法得OR=0.332,χ2=22.56,df=1,P<0.001;95%CI=0.209~0.527。
[补充练习题]
一、选择题
(一)A1型:
每一道题下面有A、B、C、D、E五个备选答案,请从中选择一个最佳答案。
1.与队列研究相比,病例-对照研究能_______。
A.估计疾病发生的频率
B.估计相对危险度
C.论证危险因素与疾病的病因关系
D.节省人力、物力与时间
E.计算归因危险度
2.关于优势比的定义,正确的是_______。
A.病例组暴露频率与非暴露频率之比除以对照组暴露频率与非暴露频率之比
B.暴露人群发病优势与非暴露人群发病优势之比
C.暴露人群发病率与非暴露人群发病率之比
D.优势比近似等于相对危险度
E.以上都不对
3.以下不会造成严重偏倚的情况是_______。
A.病例从医院选取,对照从某企业职工中选取
B.住院病例在病床边完成问卷调查,对照在家中完成
C.病例来自某综合医院,对照从相同医院选取其它与该病无关的患者
D.病例从疾病登记系统收集,选取配偶作为对照
E.病例从某专科医院选取,对照从其它综合医院病例中选取
4.优势比假设检验结果P<0.05,差异有统计学意义,说明_______。
A.危险因素与疾病发生关联密切
B.危险因素与疾病有病因关系
C.危险因素决定疾病是否发生
D.暴露于危险因素的人群发病风险较高
E.危险因素对疾病是否发生影响很大
(二)A2型:
每一道题以一个小案例出现,其下面都有A、B、C、D、E五个备选答案,请从中选择一个最佳答案。
1.一项授乳史与乳腺癌关系的1:
1病例-对照研究的结果如下表所示:
乳腺癌病人的授乳史
对照者的授乳史
有授乳史
无授乳史
合计
有授乳史
27
65
92
无授乳史
23
43
66
合计
50
108
158
估计有授乳史的乳腺癌发病优势比为_______。
A.1.29B.0.78C.0.35D.0.63E.2.83
(三)B1型:
以下提供若干组题目,每组题目共用题目前列出的A、B、C、D、E五个备选答案。
请从中选择一个与问题关系最密切的答案。
某个备选答案可能被选择一次、多次或不被选择。
(1~2题共用备选答案)
A.抽样误差B.选择偏倚C.信息偏倚
D.混杂E.随机测量误差
1.在某病例-对照研究中,病例的暴露水平是根据病案记录确定,对照的暴露水平是通过询问确定,这可能产生。
2.在肥胖与高血压的病例-对照研究中,病例来自某医院体检发现的病人,对照是医院所在地某企业职工。
该设计可能存在。
[参考答案]
一、选择题
(一)1.D2.A3.C4.D
(二)1.C
(三)1.C2.B
(柳青)