华西统计学资料随访资料的生存分析.docx

上传人:b****1 文档编号:1924044 上传时间:2023-05-02 格式:DOCX 页数:18 大小:107.31KB
下载 相关 举报
华西统计学资料随访资料的生存分析.docx_第1页
第1页 / 共18页
华西统计学资料随访资料的生存分析.docx_第2页
第2页 / 共18页
华西统计学资料随访资料的生存分析.docx_第3页
第3页 / 共18页
华西统计学资料随访资料的生存分析.docx_第4页
第4页 / 共18页
华西统计学资料随访资料的生存分析.docx_第5页
第5页 / 共18页
华西统计学资料随访资料的生存分析.docx_第6页
第6页 / 共18页
华西统计学资料随访资料的生存分析.docx_第7页
第7页 / 共18页
华西统计学资料随访资料的生存分析.docx_第8页
第8页 / 共18页
华西统计学资料随访资料的生存分析.docx_第9页
第9页 / 共18页
华西统计学资料随访资料的生存分析.docx_第10页
第10页 / 共18页
华西统计学资料随访资料的生存分析.docx_第11页
第11页 / 共18页
华西统计学资料随访资料的生存分析.docx_第12页
第12页 / 共18页
华西统计学资料随访资料的生存分析.docx_第13页
第13页 / 共18页
华西统计学资料随访资料的生存分析.docx_第14页
第14页 / 共18页
华西统计学资料随访资料的生存分析.docx_第15页
第15页 / 共18页
华西统计学资料随访资料的生存分析.docx_第16页
第16页 / 共18页
华西统计学资料随访资料的生存分析.docx_第17页
第17页 / 共18页
华西统计学资料随访资料的生存分析.docx_第18页
第18页 / 共18页
亲,该文档总共18页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

华西统计学资料随访资料的生存分析.docx

《华西统计学资料随访资料的生存分析.docx》由会员分享,可在线阅读,更多相关《华西统计学资料随访资料的生存分析.docx(18页珍藏版)》请在冰点文库上搜索。

华西统计学资料随访资料的生存分析.docx

华西统计学资料随访资料的生存分析

随访资料的生存分析

生存分析的意义和应用

无论观察性研究,还是实验(试验)性研究,有时需对研究对象进行追踪观察,不仅了解某事件发生的结局,同时还了解发生这种结局所经历的时间。

例如临床治疗措施效果评价:

白血病化疗缓解持续时间和缓解率、乳腺癌术后生存时间和生存率、肾移植术后生存时间和生存率等。

 

上述生存资料若按通常的方法进行分析,有两方面的问题:

1.n年生存率有时出现后一年大于前一年的现象。

表1某地1974—1981年胃癌根治术后随访记录

年份

例数

生存年数

1

2

3

4

5

6

7

8

1974

29

28

25

23

19

18

17

17

17

1975

26

24

19

18

18

18

16

16

1976

24

21

19

16

14

14

13

1977

32

27

23

21

18

16

1978

25

23

20

16

16

1979

36

31

29

26

1980

25

23

19

1981

46

36

合计

243

213

154

120

85

66

46

33

17

1974年—1981年共手术243例,1974年手术29例,术后1年内死亡1例,活满1年的28例,到1982年末,活满8年的17例。

以次类推。

观察满1年的243例,活满1年的213例:

1年生存率=

观察满2年的病例243-46=197例,活满2年的共154例:

2年生存率=

6年生存率=58.23%

7年生存率=60.00%

8年生存率=58.62%

由于失访或死于其它疾病而终止观察等原因,分析时,当作存活或本病死亡均不合理,当作未观察病例则损失信息。

因此,在观察例数较少同时截尾数据较多时,此法很不理想。

2.某时点生存率不能反映整个生存过程,比较时可能出现不正确的结论。

 

分析生存资料的统计方法称为生存分析(survivalanalysis)。

它是将事件的结局和发生这种结局所经历的时间两个因素综合起来分析的一种统计方法。

它能够处理截尾数据,并对整个生存过程进行分析或比较。

 

生存分析在临床医学和公共卫生等领域应用广泛:

1.临床治疗方案或处理措施的效果评价。

如恶性肿瘤手术或化疗后(转移或死亡前)生存时间、肾移植术后生存时间、心脏起搏器的保留时间、种植牙的保留时间等。

2.疾病危险因素分析和疾病预后的影响因素分析。

如肺癌发病危险因素分析、肾移植手术效果的影响因素分析等。

3.特殊人群卫生保健措施的效果评价。

如中老年糖尿病预防效果评价、青少年控制吸烟的健康教育干预试验效果评价、食管癌高发区干预措施的效果评价、不同种类宫内节育器的节育效果评价(宫内保留时间或有效避孕时间)、某疫苗接种效果评价(观察抗体滴度了解免疫力持续时间或某病发病率)等。

生存分析包括统计描述和统计推断两方面:

统计描述:

计算生存率、绘制生存率曲线、计算中位生存时间等。

统计推断:

估计总体生存率的可信区间、生存率曲线的比较。

随访研究的几个问题

一、随访内容

1.开始随访的时间:

入(出)院时间、确诊时间、开始治疗时间等可作为随访开始的时间。

如乳腺癌的乳腺切除术后第一天或出院日、白血病化疗后缓解出院日等,也可规定开始治疗日为随访开始时间。

2.随访的结局和终止随访的时间

随访的结局可能有以下几种:

①“死亡”:

泛指处理措施失败的事件。

如肿瘤化疗后的复发、肾移植因肾衰或与之有关的原因而死亡等。

终止随访时间为“死亡”时间。

②失访:

拒绝随访、失去联系或中途退出等。

终止随访时间为最后一次访问时间。

③死于与研究疾病无关的原因:

终止随访时间为死亡时间。

④研究终止。

研究终止时观察对象仍然存活。

终止随访时间为研究终止时间。

3.影响生存的有关因素:

如患者年龄、病情、病程、术前健康等情况,以便分析这些因素对生存率的影响。

二、随访方式

1.全部观察对象同时接受处理措施,观察到最后一例出现结果或事先规定的随访截止时间。

2.观察对象在不同时间接受处理措施,完成一定数量随访病例或按事先规定的时间停止随访。

生存分析的几个概念

1.“死亡”事件

“死亡”事件(deathevent)又称失败事件(failureevent),泛指标志某种措施失败或失效的事件,是根据研究目的确定的。

如乳腺癌术后死亡、白血病化疗后复发、肾移植术后的肾衰等,均可作为“死亡”事件。

2.生存时间

生存时间(survivaltime)也是一个广义概念,泛指所关心的某现象的持续时间,即随访观察持续的时间,常用符号t表示。

表26例乳腺癌患者术后随访记录

患者

编号

观察记录

生存天数

t

开始日期

终止日期

结局

(死=1,生=0)

原因

1

02-09-03

02-12-29

0

死于肺癌

118+

2

02-09-10

02-12-08

1

转移死亡

90

3

02-09-14

02-12-31

0

研究终止

108+

4

02-08-25

02-11-29

0

失访

96+

5

02-10-01

02-11-28

0

死于车祸

59+

6

02-10-04

02-12-28

1

复发死亡

86

生存时间分为两种类型:

1.完全数据(completedata):

指从观察起点到发生“死亡”事件所经历的时间。

提供了观察对象确切的生存时间。

2.截尾数据(censoreddata):

亦称截尾值(censoredvalue)或终检值。

指从观察起点到发生非“死亡”事件所经历的时间。

截尾原因即前述三种情况:

失访、死于与研究疾病无关的原因、研究终止。

截尾数据不能提供完全的信息,常用符号“+”表示。

 

三、生存率

指某个观察对象活过t时刻的概率,常用P(X>t)表示。

生存率也是一个广义概念,研究者定义的“死亡”事件不同,其含义亦不同。

如白血病化疗的失败事件是白血病复发,生存率即为缓解率;预防接种腮腺炎疫苗后,接种儿童发生腮腺炎为失败事件,此时生存率为疫苗有效率;安放宫内节育器,失败事件定义为因节育器引起的腹痛、出血过多、感染等副作用,或带环受孕导致取出节育器,此时生存率即为节育器保留率。

 

生存分析的主要内容

一、描述生存过程

计算各时点生存率、绘制生存率曲线、计算中位生存时间等。

常用方法有乘积极限法和寿命表法。

二、比较生存过程

比较两组或多组生存曲线(生存过程)。

常用方法有对数秩检验和分层对数秩检验等。

三、生存过程的影响因素分析

多因素生存分析如Cox比例风险模型分析疾病发生、发展及其预后的影响因素。

例如,分析影响鼻咽癌手术预后的因素,如年龄、病程、病情、术前健康状况、有无淋巴结转移、术后有无感染、辅助治疗措施、营养状况等。

 

生存资料的统计描述及

生存率的区间估计

一、乘积极限法

乘积极限法(product-limitestimate)又称kaplan-Meier法,适用于未分组生存资料的分析。

例1某方案治疗Ⅲ期肺癌患者11例,随访时间(月)如下。

试估计各时点生存率及其标准误。

1,2,3,5,6,9+,11,13,16,26,37+,

表3例1资料生存率及标准误的计算

生存时间(月)

X

(1)

死亡数

dX

(2)

期初

病例数

nX

(3)

死亡

概率

(4)

生存

概率

(5)

生存率

P(X>t)

(6)

生存率

标准误

sP(X>t)

(7)

1

1

11

1/11

1-1/11

0.9091

0.0867

2

1

10

1/10

1-1/10

0.8182

0.1163

3

1

9

1/9

1-1/9

0.7273

0.1343

5

1

8

1/8

1-1/8

0.6364

0.1450

6

1

7

1/7

1-1/7

0.5455

0.1501

9+

0

6

0

1

0.5455

0.1501

11

1

5

1/5

1-1/5

0.4364

0.1638

13

1

4

1/4

1-1/4

0.3273

0.1550

16

1

3

1/3

1-1/3

0.2182

0.1364

26

1

2

1/2

1-1/2

0.1091

0.1030

37+

0

1

0

1

0.1091

0.1030

生存率的计算

1.生存时间X:

由小到大排列,遇非截尾和截尾值相同,截尾值排后。

2.死亡数dx:

与生存时间X对应。

注意:

截尾值对应的个体未发生“死亡”事件,故死亡数为0。

3.期初病例数nx,表示恰好在该时刻以前的病例数。

如n5为8,表示恰好在5月时点前有8人存活。

4.死亡概率qx,表示X月前的观察对象恰好在X月时点死亡的概率。

5.生存概率

,表示X月前的观察对象恰好在X月时点存活的概率。

6.生存率P(X>t)。

表示该人群恰好活过t时刻的概率。

它为小于和等于t时刻的各时点生存概率的乘积。

7.生存率的标准误

例如,P(X>3)的标准误为

 

生存率曲线

未分组资料的生存率曲线称Kaplan-Meier曲线,它是以时间t为横轴,生存率P(X>t)为纵轴的曲线,其中水平横线表示从一个时点到下一个时点的距离。

可对某一个体任意时刻的生存率作出估计,反之亦可由任意生存率估计生存时间。

生存率0.5所对应的生存时间即中位生存时间。

由图可见,生存率P(X>t)=0.5时,中位生存时间的估计值在6~11月之间:

①生存时间具有截尾值,一般不呈正态分布,故不宜用平均生存时间来描述生存资料。

②若生存率0.5处所对应的曲线与X轴平行,则中位生存时间不止一个。

③若Kaplan-Meier曲线上生存率全大于0.5,则中位生存时间无法估计。

总体生存率可信区间的估计

正态近似原理估计某时点总体生存率可信区间:

生存率曲线尾部的生存率不适合于用该法计算总体生存率的可信区间。

 

二、寿命表法

适用于分组的生存资料。

①实际工作中,随访结果常常没有每个观察对象确切的生存时间,只能获得按随访时间分组的资料。

②当样本较大(如n≥50)时,采用乘积极限法估计生存率及其标准误较为繁琐。

 

例2 某院对100例确诊的原发性肝癌患者进行随访,见表第

(1)至(3)栏。

据此资料计算生存率和标准误。

表2 100例原发性肝癌患者生存率及标准误

确诊后

月数

(1)

期内失访人数

(2)

期内死亡人数

(3)

期初观察人数

(4)

校正人数

(5)

死亡概率

(6)

生存概率

(7)

n月

生存率

(n=X+1)

(8)

生存率标准误

(9)

0~

2

17

100

99

0.1717

0.8283

0.8283

0.0379

1~

1

26

81

80.5

0.3230

0.6770

0.5608

0.0502

2~

3

27

54

52.5

0.5143

0.4857

0.2724

0.0457

3~

2

15

24

23

0.6522

0.3478

0.0947

0.0314

4~

0

2

7

7

0.2857

0.7143

0.0677

0.0277

5~

1

2

5

4.5

0.4444

0.5556

0.0376

0.0221

6~

0

0

2

2

0.0000

1.0000

0.0376

0.0221

7~

1

0

2

1.5

0.0000

1.0000

0.0376

0.0221

8~9

0

1

1

1

1.0000

0.0000

0.0000

生存率的计算

1.确诊后月数X~:

“0~”表示从确诊日起不满一月,“1~”表示确诊后1月至不满2月,依次类推。

2.期内失访人数WX:

泛指具有截尾数据的人,表示随访已满X月,但在未满X+1月期间失访的人。

3.期内死亡人数

指期内死于肝癌的人数。

4.期初观察人数

指时刻X以前的人数。

5.校正人数NX:

相当于实际观察人时数。

在各月月初观察人数中减去同月失访人数的一半。

6.死亡概率

指活满X月的病人在X+1月内死亡的概率。

7.生存概率

指活满X月的病人在X+1月内存活的概率,即在活过某时刻的条件下,再活下一时间段的概率。

8.n月生存率

,表示活过n月的概率。

9.生存率标准误的计算。

生存率曲线

以生存月数X为横轴,n月生存率

为纵轴作生存率曲线。

总体生存率可信区间的估计

根据正态近似原理用

估计。

不宜用该法计算接近尾部的生存率可信区间。

 

生存曲线比较的假设检验

——对数秩检验

对数秩检验(log-ranktest)的基本思想是:

若无效假设成立,则根据各个时点两组的期初观察人数和死亡概率,计算两组在各个时点的理论死亡数。

如无效假设成立,理论死亡数与实际死亡数应相差不大。

反之,则不支持无效假设成立,进而认为两条生存曲线差异有统计学意义。

对数秩检验可用于两个或多个样本生存曲线的比较,其检验统计量:

v=组数-1

当有T小于5时,用下式计算校正

值。

 

例3 将22例Ⅲ期非小细胞肺癌患者随机分配到放疗组和放化疗联合组,从缓解出院日开始随访,随访时间(月)如下。

比较放疗和放化疗联合两种治疗方案的生存率曲线有无差别。

甲:

放疗组 1,2,3,5,6,9+,11,13,16,26,37+

乙:

放化疗联合组 10,11+,14,18,22,22,26,32,38,40+,42+

1.建立检验假设和确定检验水准

H0:

单放疗与放化疗联合两治疗方案的生存率曲线分布相同

H1:

单放疗与放化疗联合两治疗方案的生存率曲线分布不同

=0.05

 

2.计算统计量

表3 单放疗组和放化疗联合组理论死亡数的计算

序号

组别

观察时间

死亡数

期初病例数

理论病死数

(1)

(2)

t

(3)

d

(4)

n甲

(5)

n乙

(6)

合计

(7)

(8)=(4)×(5)/(7)

(9)=(4)×(6)/(7)

1

1

1

11

11

22

0.5000

0.5000

2

2

1

10

11

21

0.4762

0.5238

3

3

1

9

11

20

0.4500

0.5500

4

5

1

8

11

19

0.4211

0.5789

5

6

1

7

11

18

0.3889

0.6111

6

9+

0

6

11

17

0.0000

0.0000

7

10

1

5

11

16

0.3125

0.6875

8

11+

1

5

10

15

0.3333

0.6667

9

11

0

4

10

14

0.0000

0.0000

10

13

1

4

9

13

0.3077

0.6923

11

14

1

3

9

12

0.2500

0.7500

12

16

1

3

8

11

0.2727

0.7273

13

18

1

2

8

10

0.2000

0.8000

14

22

2

2

7

9

0.4444

1.5556

15

甲乙

26

2

2

5

7

0.5714

1.4286

16

32

1

1

4

5

0.2000

0.8000

17

37+

0

1

3

4

0.0000

0.0000

18

38

1

0

3

3

0.0000

1.0000

19

40+

0

0

2

2

0.0000

0.0000

20

42+

0

0

1

1

0.0000

0.0000

合计

5.1282

11.8718

表4 例3对数秩检验总结表

组别

观察死亡数

A

理论死亡数

T

死亡比

A/T

9

5.1282

1.7550

8

11.8718

0.6739

v=2-1=1

3.求出P值,作出统计推断

界值表,得P<0.05,在

=0.05水准拒绝H0,接受H1,可以认为单独放疗和放化疗联合治疗Ⅲ期非小细胞肺癌的生存率曲线分布不同,放化疗联合治疗的效果较好(因为A组死亡比大,表示B组生存率曲线高)。

对于分组资料,计算公式完全相同,只是表中d、n甲、n乙、n分别表示对应于各观察时间区间的比较组的死亡人数、甲组校正人数、乙组校正人数、合计校正数。

对数秩检验也可用于三组生存曲线的比较。

由对数秩检验过程可知,若每一时点A组死亡率都高一点(生存率低一点),则检验结果必然为A不同于B。

因此,在比较的两条生存率曲线无交叉时,直接用对数秩检验是合适的。

反之,就需进一步分析原因,了解是否存在混杂因素的影响。

例4为比较A、B两治疗方案对某病的治疗效果,将25名病人随机分成2组,分别给予A、B两种治疗。

治疗前检查每名患者肾功能(记功能正常者为0,不正常为1),治疗后的生存时间(天)如下。

表5A、B两组病人生存时间及肾功能

A组

B组

生存时间

肾功能

生存时间

肾功能

8

1

180

0

852+

0

632

0

52

1

2240+

0

220

0

195

0

63

1

76

0

8

0

70

0

1976+

0

13

1

1296+

0

23

1

1460+

0

1296

0

63

1

210

0

1328+

0

700

0

365+

0

18

1

1990+

0

如忽略肾功能的不同,按前述对数秩检验,算得A、B两组的理论死亡数为:

表6 对数秩检验总结表

组别

观察死亡数(A)

理论死亡数(T)

A

6

8.3376

B

11

8.6624

若分析两组死亡病人的肾功能情况,A组6个死亡者中4人肾功能不正常,占66.7%,B组11个死亡者中3人肾功能不正常,占27.3%。

可采用分层对数秩检验调整混杂因素的影响。

即先按混杂因素分层,分别计算各层的各组理论死亡数,将各层的理论死亡数相加得各组总的理论死亡数,然后再计算

值。

表7分层对数秩检验

肾功能正常

肾功能不正常

A组

生存天数

B组

生存天数

A组

生存天数

B组

生存天数

852+

180

8

13

220

632

52

18

8

2240+

63

23

1976+

195

63

1296+

76

1460+

70

1328+

1990+

365+

700

210

1296

 

表8分层对数秩检验总结表

A组

B组

A

T

A

T

肾功能正常

2

5.0092

8

4.9908

肾功能不正常

4

5.4214

3

1.5786

合计

6

10.4306

11

6.5694

,A疗法的病人生存期较长,A疗法优于B疗法。

 

如果比较两组还有其他混杂因素,则再分层。

在样本较小同时分层较多时,采用多因素生存分析方法如常用的Cox比例风险模型等。

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 初中教育 > 语文

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2