精品生存分析教程资料下载.pdf

上传人:wj 文档编号:5968567 上传时间:2023-05-05 格式:PDF 页数:63 大小:1.11MB
下载 相关 举报
精品生存分析教程资料下载.pdf_第1页
第1页 / 共63页
精品生存分析教程资料下载.pdf_第2页
第2页 / 共63页
精品生存分析教程资料下载.pdf_第3页
第3页 / 共63页
精品生存分析教程资料下载.pdf_第4页
第4页 / 共63页
精品生存分析教程资料下载.pdf_第5页
第5页 / 共63页
精品生存分析教程资料下载.pdf_第6页
第6页 / 共63页
精品生存分析教程资料下载.pdf_第7页
第7页 / 共63页
精品生存分析教程资料下载.pdf_第8页
第8页 / 共63页
精品生存分析教程资料下载.pdf_第9页
第9页 / 共63页
精品生存分析教程资料下载.pdf_第10页
第10页 / 共63页
精品生存分析教程资料下载.pdf_第11页
第11页 / 共63页
精品生存分析教程资料下载.pdf_第12页
第12页 / 共63页
精品生存分析教程资料下载.pdf_第13页
第13页 / 共63页
精品生存分析教程资料下载.pdf_第14页
第14页 / 共63页
精品生存分析教程资料下载.pdf_第15页
第15页 / 共63页
精品生存分析教程资料下载.pdf_第16页
第16页 / 共63页
精品生存分析教程资料下载.pdf_第17页
第17页 / 共63页
精品生存分析教程资料下载.pdf_第18页
第18页 / 共63页
精品生存分析教程资料下载.pdf_第19页
第19页 / 共63页
精品生存分析教程资料下载.pdf_第20页
第20页 / 共63页
亲,该文档总共63页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

精品生存分析教程资料下载.pdf

《精品生存分析教程资料下载.pdf》由会员分享,可在线阅读,更多相关《精品生存分析教程资料下载.pdf(63页珍藏版)》请在冰点文库上搜索。

精品生存分析教程资料下载.pdf

例如例如,急性白血病病人从治疗开始到复发为止之间急性白血病病人从治疗开始到复发为止之间的缓解期的缓解期;

冠心病病人两次发作之间的时间间隔冠心病病人两次发作之间的时间间隔。

戒烟开始到复发吸烟之间的时间长短戒烟开始到复发吸烟之间的时间长短;

接触危险因素到发病等接触危险因素到发病等。

生存分析中最基本的一点就是计算生存生存分析中最基本的一点就是计算生存时间(小时时间(小时、日日、月月、年年)生存时间生存时间=事件终点事件终点事件起点事件起点事件终点事件终点:

(1)有完整结局的事件有完整结局的事件-完全数据完全数据

(2)无完整结局的事件无完整结局的事件-截尾数据截尾数据两种数据类型两种数据类型:

完全数据(完全数据(completedata):

从起点至死亡所从起点至死亡所经历的时间经历的时间,即死者的存活时间即死者的存活时间。

完全数据提供了完全数据提供了病人确切的死亡时间病人确切的死亡时间,是生存分析的主要依据是生存分析的主要依据。

截尾数据(截尾数据(censoreddata):

在随访工作中在随访工作中,由由于某种原因未能观察到病人的明确结局(即终于某种原因未能观察到病人的明确结局(即终止事件)止事件),所以不知道该病人的确切生存时间所以不知道该病人的确切生存时间,称之为截尾称之为截尾。

从起点至截尾点所经历的时间从起点至截尾点所经历的时间,称为截尾数据称为截尾数据。

它能提供部分信息它能提供部分信息,说明病人说明病人在某时刻之前没有死亡在某时刻之前没有死亡,一般用于确定暴露人一般用于确定暴露人口口。

产生截尾数据的原因产生截尾数据的原因:

病人失访病人失访。

由于搬迁而失去联系由于搬迁而失去联系,或由于其他原因或由于其他原因死亡死亡,而未观察到规定的终点事件而未观察到规定的终点事件。

病人的生存期超过了研究的终止期病人的生存期超过了研究的终止期,如研究计划规如研究计划规定只对病人随访定只对病人随访5年年,但有的病人的生存但有的病人的生存期超过了期超过了5年年,或者由于病人进入研究或者由于病人进入研究的时间较晚的时间较晚,虽然对他的随访期未满虽然对他的随访期未满5年年,但已到研究的截止时间但已到研究的截止时间。

在动物实验中在动物实验中,有时事先规定观察期限或动物数有时事先规定观察期限或动物数。

虽然有一部分动物在到达实验终止日期时虽然有一部分动物在到达实验终止日期时尚未现出规定的终止事件尚未现出规定的终止事件,但仍停止实但仍停止实验验,或者当达到了事先规定的终止事件的或者当达到了事先规定的终止事件的动物数后实验停止动物数后实验停止。

生存时间资料的特点生存时间资料的特点:

效应变量有效应变量有2个个,即即生存时间生存时间(天数(天数)和和结局结局(死亡与否(死亡与否、是否复发是否复发、是否阳性等)是否阳性等)。

存在截尾数据存在截尾数据。

分布类型复杂分布类型复杂生存时间资料常通过随访获得生存时间资料常通过随访获得,因观察时间长且难以控制混杂因素因观察时间长且难以控制混杂因素,故其分布故其分布类型复杂类型复杂,常呈指数分布常呈指数分布、Weibull分布分布、对数对数正态分布正态分布、对数对数logistic分布或更为复杂的分布分布或更为复杂的分布,生物医学中的是生存时间分布呈现偏态和不规生物医学中的是生存时间分布呈现偏态和不规则状态则状态,影响因素较多影响因素较多,因此难以用传统的统因此难以用传统的统计方法对这类数据进行处理计方法对这类数据进行处理。

常见的随访方式有两种常见的随访方式有两种:

全体观察对象同时接受处理措施全体观察对象同时接受处理措施,观察到最后观察到最后一例出现结果一例出现结果,或者事先规定的随访截止时间或者事先规定的随访截止时间,如图如图b。

图中图中“”表示“死亡表示“死亡”,“o”表示失访表示失访、退退出研究或死于与本处理无关的其他原因出研究或死于与本处理无关的其他原因。

0始点t终点b时间全体观察对象在不同时间接受治疗处理全体观察对象在不同时间接受治疗处理,根据完成一定根据完成一定数量随访病例决定随访截止时间数量随访病例决定随访截止时间,或按事先规定的时或按事先规定的时间停止随访间停止随访,这是临床试验最常见的形式这是临床试验最常见的形式,如图如图a。

如病人在不同时间接受心脏移植手术如病人在不同时间接受心脏移植手术,有的病人可能术后有的病人可能术后20年仍然存活年仍然存活,而随访难以持续那么长的时间而随访难以持续那么长的时间,可根可根据不同的研究内容据不同的研究内容,按设计时的要求观察到预定时间按设计时的要求观察到预定时间,如如3年或年或5年即截止随访年即截止随访。

0始点t终点a时间生存时间资料的基本要求生存时间资料的基本要求样本由随机抽样方法获得样本由随机抽样方法获得,有代表性有代表性,并并应有足够的数量应有足够的数量。

死亡例数不能太小死亡例数不能太小;

截尾值比例不能太大截尾值比例不能太大。

截尾原因无偏性截尾原因无偏性如老年患者常因不重视随访而如老年患者常因不重视随访而失访失访,由此可能使估计的生存率偏高由此可能使估计的生存率偏高。

为防止截尾为防止截尾偏性偏性,常需对被截尾者的年龄常需对被截尾者的年龄、职业和地区等构成职业和地区等构成情况进行分析情况进行分析。

缺项要尽量补齐缺项要尽量补齐。

生存分析研究的主要内容生存分析研究的主要内容描述生存过程描述生存过程-研究生存时间的分布特点研究生存时间的分布特点,估计生存率估计生存率及平均存活时间及平均存活时间,绘制生存曲线等绘制生存曲线等。

-根据生存时间的长短根据生存时间的长短,可以估计出各时可以估计出各时点的点的生存率生存率,并根据生存率来估计并根据生存率来估计中位生中位生存时间存时间。

同时也可根据同时也可根据生存曲线分析其生生存曲线分析其生存特点存特点。

比较生存过程比较生存过程-可通过生存率及其标准误对各样本的可通过生存率及其标准误对各样本的生存率进行比较生存率进行比较,以探讨各组间的生存以探讨各组间的生存过程是否有差别过程是否有差别。

例如比较手术治疗和化学治疗乳腺癌患例如比较手术治疗和化学治疗乳腺癌患者的生存率者的生存率,以探讨何种治疗方案较好以探讨何种治疗方案较好。

影响生存时间的因素分析影响生存时间的因素分析-其重点是通过生存分析模型来探讨时其重点是通过生存分析模型来探讨时间及结局作为因变量而将影响他们的因间及结局作为因变量而将影响他们的因素作为自变量素作为自变量,比如年龄比如年龄、性别性别、病理病理分期分期、治疗方式等治疗方式等。

-通过模型分析找出影响和生存时间的通过模型分析找出影响和生存时间的保护因素和不利因素保护因素和不利因素。

二二、生存率的生存率的Kaplan-Meier法法也称未分组资料的生存分析也称未分组资料的生存分析。

其特点是其特点是:

-当随访的病例数较少时当随访的病例数较少时,不需要将病人的不需要将病人的随访时间进行分组随访时间进行分组。

-根据实际资料计算不同时间的死亡概率和根据实际资料计算不同时间的死亡概率和生存概率生存概率,然后采用条件概率及概率乘法然后采用条件概率及概率乘法的原理计算生存率的原理计算生存率。

在在SPSS的的survival菜菜单中单中,可选择可选择Kaplan-Meier过程计算生存过程计算生存率率。

1.死亡概率和生存概率死亡概率和生存概率q=某年内死亡数某年年初观察例数1pq=某年活满一年人数某年年初人口数校正人口数校正人口数=(年初人口数年初人口数截尾例数截尾例数)2.生存率生存率(survivalrate)-记为记为S(ti),指某观察对象经历指某观察对象经历ti个单位个单位时间之后仍存活的概率时间之后仍存活的概率,-如如S(15),表示某观察对象活过表示某观察对象活过15天天(或或月月、年年)之后仍存活的概率之后仍存活的概率-生存率即累计生存概率生存率即累计生存概率S(ti)=P(Tti)=P1P2P3Pi3.半数生存期半数生存期(mediansurvivaltime)及及四分位数间距四分位数间距QT50=生存率为生存率为0.5时所对应的时间时所对应的时间表示有表示有50%的个体可活到这个时间的个体可活到这个时间,反映生存反映生存期的平均水平期的平均水平,也称中位生存时间也称中位生存时间.Q=T25T75表示中间半数病人生存期的分布范围表示中间半数病人生存期的分布范围.T25是第是第25百分位数百分位数,25%T75是第是第75百分位数百分位数,75%例例1.某医师比较某医师比较A、B两种药物治疗某肿瘤病人后的两种药物治疗某肿瘤病人后的效果效果。

收集的资料有收集的资料有手术时间手术时间、病人死亡时间病人死亡时间、观察终止时间观察终止时间、各种结局各种结局,做生存分析做生存分析。

定义变量定义变量:

groupA=1,B=2status死亡死亡=1,未死亡未死亡=0time生存时间(天生存时间(天)=死亡时间(终止时间死亡时间(终止时间)-手术时间手术时间-GroupA药药

(1)B药(药

(2)timestatustimestatus(天(天)(天(天)-851741125113811251182112502351.-SPSSKaplan-MeierKMtimeBYgroup/STATUS=status

(1)/PERCENTILES/PLOTSURVIVAL/TESTLOGRANK/COMPAREOVERALLPOOLED.SurvivalTable85.000.857.13216125.000.25125.000.571.18734125.000.33183.000.381.19942258.000.190.16851433.000.5074.000.857.13216138.000.714.17125182.000.571.18734235.000.429.18743235.000.42429.000.214.17851477.000.000.0006012345671234567groupABTimeStatusEstimateStd.ErrorCumulativeProportionSurvivingattheTimeNofCumulativeEventsNofRemainingCasesSPSSKaplan-Meier法法输出结果输出结果

(1)生存率生存率Percentiles258.00065.975183.00060.699125.00026.186429.000100.545235.00069.393138.00064.542429.000117.600183.00046.117125.00028.796groupABOverallEstimateStd.ErrorEstimateStd.ErrorEstimateStd.Error25.0%50.0%75.0%

(2)中位生存时间及百分位数中位生存时间及百分位数SurvivalFunctionsTIME5004003002001000CumSurvival1.21.0.8.6.4.20.0-.2GROUP2B药2-censored1A药1-censored(3)生存曲线生存曲线进行两条曲线的比较目测中位生存时间,及第25%、75%位的生存时间OverallComparisons.1841.668LogRank(Mantel-Cox)Chi-SquaredfSig.Testofequalityofsurvivaldistributionsforthedifferentlevelsofgroup.(4)生存率的比较生存率的比较-Log-rank检验检验H0:

两种药物的总体生存曲线相同两种药物的总体生存曲线相同H1:

两种药物的总体生存曲线不相同两种药物的总体生存曲线不相同v=1,2=0.18P=0.6677还不能认为还不能认为两种药物治疗后的生存曲线不同两种药物治疗后的生存曲线不同.22()ATT=三三、生存率的生存率的LifeTable法法当样本例数较多当样本例数较多,或已经整理成频数表形式的或已经整理成频数表形式的生存数据可以按寿命表法计算生存率生存数据可以按寿命表法计算生存率.其基本原理其基本原理:

-确定等距的时间间隔确定等距的时间间隔-求出患者在治疗后各时期的生存概率求出患者在治疗后各时期的生存概率-根据概率的乘法法则根据概率的乘法法则,将各时期生存概率相乘将各时期生存概率相乘,即得到自观察开始到各时点的生存率即得到自观察开始到各时点的生存率.如如:

1年生存率年生存率=P15年生存率年生存率=P1P2P3P4P5例例2:

某研究者收集了女性脑溢血患者某研究者收集了女性脑溢血患者2552例例,试计算该病患者的试计算该病患者的1年生存率年生存率、3年生存率年生存率、5年生存率年生存率、估计估计5年总体生存率的年总体生存率的95%置信区间置信区间、及中位生存时间及中位生存时间。

1年生存率年生存率=P1=0.83193年生存率年生存率=P1P2P3=0.83190.89950.9422=0.70515年生存率年生存率=P1P2P3P4P5=0.70510.90370.8965=0.5713)iitt,1

(1)

(2)死亡人数(3)截尾人数(4)期初观察人数(5)校正人数(6)=

(2)/(5)死亡概率(7)=1-(6)生存概率(8)生存率(9)生存率的标准误0,1)429025522552.00.16810.83191.0000-1,2)2122521232110.50.10050.89950.83190.00742,3)1083618861868.00.05780.94220.74830.00863,4)1671417421735.00.09630.90370.70510.00914,5)1594915611536.50.10350.89650.63720.00965,6)19518713531259.50.15480.85420.57130.00996,7)18393971924.50.19790.80210.48280.01022552例女性脑溢血病人生存率及标准误计算分析表例女性脑溢血病人生存率及标准误计算分析表WEIGHTBYnum.SURVIVALTABLE=time/INTERVAL=THRU12BY1/STATUS=status

(1)/PRINT=TABLE/PLOTS(SURVIVAL)=time.SPSSLifeTable生存分析生存分析LifeTablea255202552.000429.17.83.832123252110.500212.10.90.751886361868.000108.06.94.711742141735.000167.10.90.641561491536.500159.10.90.5713531871259.500195.15.85.4897193924.500183.20.80.39695139625.50067.11.89.3548983447.50069.15.85.2933764305.00042.14.86.2523145208.50049.24.76.191377599.50012.12.88.17IntervalStartTime01234567891011NumberEnteringIntervalNumberWithdrawingduringIntervalNumberExposedtoRiskNumberofTerminalEventsProportionTerminatingProportionSurvivingCumulativeProportionSurvivingatEndofIntervalThemediansurvivaltimeis5.81a.SPSSLifeTable输出结果中位生存时间为中位生存时间为:

(0.57130.5000)T50=5+-=5.8(年年)(0.57130.4828)2552例女性脑溢血患者中有例女性脑溢血患者中有50%的的人能活人能活5.8年年。

总体生存率总体生存率1-的置信区间的置信区间:

S(ti)Z/2SES(ti),若若=0.05,i=55年总体生存率年总体生存率95%的置信区间为的置信区间为:

S(5)1.96SES(5)=0.57131.960.0099=(0.5518,0.5907)四四、Cox比例风险模型简介比例风险模型简介Cox模型是一种多元统计分析方法模型是一种多元统计分析方法,可以分析可以分析多种因素对疾病预后的影响多种因素对疾病预后的影响。

Cox模型使临床观模型使临床观察的定性指标又加上定量指标进行分析察的定性指标又加上定量指标进行分析,提高提高了分析的效率了分析的效率。

传统的临床疗效指标多是定性的指标传统的临床疗效指标多是定性的指标,如病如病人的治愈人的治愈、死亡等死亡等,Cox模型不仅利用上述定性模型不仅利用上述定性指标指标,同时还分析病人的生存时间同时还分析病人的生存时间,增加了数增加了数据的信息量据的信息量,用较少样本就可以得到可靠的用较少样本就可以得到可靠的结论结论。

Cox模型具有一般回归分析的特点模型具有一般回归分析的特点,在其他因素固定在其他因素固定的情况下的情况下,可以比较某一因素的不同水平的生存时间可以比较某一因素的不同水平的生存时间的影响的影响。

在各病人因素已知的情况下在各病人因素已知的情况下,可以预测不同可以预测不同时刻病人的生存期时刻病人的生存期。

Cox模型与模型与Logistic回归分析相比具有相似之处回归分析相比具有相似之处,即在即在估计出回归系数后估计出回归系数后,可以得到相应因素的相对危险度可以得到相应因素的相对危险度,但但Logistic分析时只考虑了事件的结果分析时只考虑了事件的结果,而没有考虑生而没有考虑生存时间的长短存时间的长短,因此因此,Cox模型更多的利用了资料的模型更多的利用了资料的信息信息。

例例3.为探讨乳腺癌的预后为探讨乳腺癌的预后,收集了收集了54例病人的生存时间例病人的生存时间、治疗结局及(治疗结局及(6个个)有关影响因素有关影响因素。

-变量变量定义定义量化值量化值-X1病人的年龄病人的年龄岁岁X2有无月经有无月经无无0有有1X3肿瘤大小肿瘤大小=51X4淋巴结是否转移淋巴结是否转移否否0是是1X5组织学类型组织学类型中高分化中高分化0低分化低分化1X6PR阴性阴性0阳性阳性1t病人的生存时间病人的生存时间月月y治疗结局治疗结局截尾截尾0死亡死亡1-NOX1X2X3X4X5X6ty14710101117024401011580Cox模型的基本形式模型的基本形式h(t,X)=h0(t)exp(1x1+2x2+.+pxp)X指可能影响死亡率的危险因素指可能影响死亡率的危险因素,也称协变量也称协变量。

t表示生存时间表示生存时间h(t,X)指具有协变量指具有协变量X的个体在时刻的个体在时刻t时的风险时的风险函数函数,又称瞬时死亡率又称瞬时死亡率。

h0(t)是基线风险率是基线风险率,此时所有的协变量取值为此时所有的协变量取值为0。

i是回归系数是回归系数,其估计值其估计值Bi可以从样本中计算得到可以从样本中计算得到。

如果假设某危险因素如果假设某危险因素X在非暴露组取值为在非暴露组取值为0,在暴露组取值为在暴露组取值为1,00()exp()(,1)exp()(,0)()hthtxRRhtxht=式中暴露组与非暴露组的危险率之比式中暴露组与非暴露组的危险率之比,称为称为相对危险度相对危险度RRCOX模型中的回归系数模型中的回归系数就是就是0-1变量变量X的的相对危险度的自然对数相对危险度的自然对数若计算得到回归系数若计算得到回归系数,便可得到便可得到RR值值公式中公式中的解释的解释:

-0,x取值越大时取值越大时,表示病人死亡表示病人死亡的风险越大的风险越大。

-=0,则则x的取值对死亡风险无影响的取值对死亡风险无影响。

-1,倍数越大倍数越

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 解决方案 > 学习计划

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2