多因素分析Word格式.docx

上传人:b****3 文档编号:7197707 上传时间:2023-05-08 格式:DOCX 页数:17 大小:24.95KB
下载 相关 举报
多因素分析Word格式.docx_第1页
第1页 / 共17页
多因素分析Word格式.docx_第2页
第2页 / 共17页
多因素分析Word格式.docx_第3页
第3页 / 共17页
多因素分析Word格式.docx_第4页
第4页 / 共17页
多因素分析Word格式.docx_第5页
第5页 / 共17页
多因素分析Word格式.docx_第6页
第6页 / 共17页
多因素分析Word格式.docx_第7页
第7页 / 共17页
多因素分析Word格式.docx_第8页
第8页 / 共17页
多因素分析Word格式.docx_第9页
第9页 / 共17页
多因素分析Word格式.docx_第10页
第10页 / 共17页
多因素分析Word格式.docx_第11页
第11页 / 共17页
多因素分析Word格式.docx_第12页
第12页 / 共17页
多因素分析Word格式.docx_第13页
第13页 / 共17页
多因素分析Word格式.docx_第14页
第14页 / 共17页
多因素分析Word格式.docx_第15页
第15页 / 共17页
多因素分析Word格式.docx_第16页
第16页 / 共17页
多因素分析Word格式.docx_第17页
第17页 / 共17页
亲,该文档总共17页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

多因素分析Word格式.docx

《多因素分析Word格式.docx》由会员分享,可在线阅读,更多相关《多因素分析Word格式.docx(17页珍藏版)》请在冰点文库上搜索。

多因素分析Word格式.docx

1、疾病诊断:

用判别分析的方法诊断疾病又称为计量诊断。

包括临床诊断、X线诊断、心电图诊断、超声波诊断、脑电图诊断等。

2、疾病预报:

流行病预报、某些疾病(心肌梗死、中风)的早期预报。

3、预后估计:

某些疗法的疗效估计,某些恶性肿瘤患者的生存期估计等。

4、疾病的病因学估计:

研究引起疾病的原因,并分析其主要影响因素。

判别分析:

要求Y变量二分类或多分类的属性变量。

分别用Fisher和Bayes准则进行计算。

同时根据样本中个体的症状、体征选用多元逐步判别分析的方法,来判断病人患的什么疾病。

其判别函数为:

Z=biXi+b:

x2+b3x3•••..+bkxk

对判别函数在实际应用中的判别能力要进行检验。

判别临界ffl:

岭=qy⑷+n2y(b)/+n2]

且:

__

艸)>人>歹0)

所以:

若Y>

Yo判为A类;

若Y<

Y0判为B类。

可以计算各指标的贡献率,进行回代检验其符合率。

1、有健康人10名,心肌梗死病人6名,分别进行心电图检查得到三个指标X】、X:

、X3O建立这两类人的判别式,以次判别新的就诊患者是否为心肌梗死病人。

2、对正常人和口血病人进行血清学方面的研究,用高分辨核磁共振谱仪分析a峰形,以a峰的高度(XJ和峰腰(XJ的宽度作为观察指标,采集了13名白血病人和11名献血员作为健康人的血清的a峰形。

3、现有己知分类的健康人11人,硬化症患者7人,冠心病患者5人,这23人的心电图的5个指标测量数据,建立判别方程。

3、logistic回归分析

多元线性回归要求y是呈正态分布的连续型随机变量。

医学中常见这样的试验:

动物服药后是生(假设其值为1)还是死(假设其值为0),或是发病

(1)还是未发病(0)等。

当因变量取值为(0,1),自变量可能是分类变量,也可能是连续变量时,用线性回归分析的方法进行处理是不合适的,应选用Logistic回归。

Logistic回归属于概率型回归,用来分析某类事件发生的概率与口变量之间的关系。

适用于因变量为二值变量(或多分类)的情形。

基本概念:

因变量的预测值在0~1之间。

如根据冠心病病人的饮食特点、吸烟史、生活的方式、得病的类型等数据资料,建立一个logiStic回归方程来预测病人的冠心病的可能性。

数学模型:

y=ln[p//(l-吠

式中:

匕是在条件勺=(夠,切,也%)下,某事件发生的概率,

1-厂是该事件不发生的概率。

其中,,=1~加,m是自变量的个数。

a是截距,S是待估计的参数。

Logistic回归方程的曲线为S型,预测值最大值趋近1,最小值趋近Oo

logistic回归方程的另一种表达形式:

强叭通过变换[l+exp(y)J

可以得出P与多元变量Xi间的数学表达式:

p=

l+exp(G+》$Xj)

\-p=5

exp(rz+£

/?

%;

1、某医生研究哪些指标可以判断糖尿病患者是否动脉硬化,将临床症状颈总动脉中层厚度imt0.8mm或有斑块定义为动脉硬化,记为因变暈type=1,非硬化imt<

0.8mm且无斑块,记为因变量type=0。

选择自变量为年龄(age)>

尿白蛋白(ALB)、体重指数(BMI)、胰岛素敏感指数(ISI)、收缩压(SBP)、甘油三脂(TG)、胆固醇(CH0)、糖尿病病程(DURA)o

2、某医院为研究医院内尿路感染的主要危险因素,回顾调查了某年

三个月份在住院期间实施保留导尿的200名患者,分别记录了

危险因素

变量名

定义

性别

X:

女=0,男二1

年龄(岁)

<

30=0,30、=1,50、二2,70~二3

插管前住院时间(天)

x3

3=0,3~=1,10、二2,20、二3

导尿方式

X,

闭式二0,开放式=1

导尿期间无抗生素持续冲洗

x5

否=0,是=1

留置导尿时间

x6

3=0,3~=1,10~二2,20、二3

感染前有无输血史

X;

无=0,有=1

感染前有无应用免疫抑制剂

Xs

无-0,用-1

插管前血浆肌酊水平

x9

80=0,80、=1,170~二2

有无糖尿病

XiO

否二0,是=1

尿路感染

Y

未感染二1,感染=0

分析可能在医院内尿路感染的危险因素。

4、比例风险模型一C0X回归

常用统计描述和统计推断的方法有:

分位数、中数生存期、平均数、生存函数古迹、判断生存时间分布、非参数检验、寿命表法、log-rank检验(对数秩检验)等。

这些方法己经系统地应用在医学的医疗评价和预后的因素分析中。

医学临床生存资料有别于其他资料,特别是医学临床随访资料很难用一般统计方法来处理多种因素对生存时间序列的影响。

资料的特点是:

1、危险度的变化规律种类多且难以确定。

2、资料中存在失访(截尾)数据。

3、同是考虑多个变量(连续的或离散的)影响难以控制。

非参数可以解决前两个问题,参数法可以解决后两个问题。

所以实际应用中有很大的局限性。

Logistic模型中对任一个观察对象的失效处理都是相同的,无论失效发生在随访期的开始或结束,所以当分析变量与失效的关系时且需要考虑失效时间的作用时,logistic回归模型就不完全适用了。

而任一变量对失效的作用完全独立于随访期的长短,直接影响结论的可靠性和稳定性。

1972年英国生物统计学家D.R.Cox提出半参数的比例风险模型Cox回归模型(Coxregressionmodel),1975年由油料新的补充。

Cox模型是将生存时间和因素间的关系用回归方式来表示,主要解决多因素(如年龄、职业、吸烟、饮酒、病情、治疗方法等)对生存期(恢复期)的影响。

对于每一个研究的病人除去要考察的因素外,必须有生存时间变量(t)和结局变量(d)。

风险函数为:

=〃(〉(f)cxp(勺X]+b2x2+b3x3+-+bpxp)

〃⑴为风险函数,又称风险率或瞬间死亡率。

九⑴为基准风险函数,是与时间有关的任意函数。

1、某省肿瘤医院调查1991-1994年间经手术治疗的66例大肠癌患者的资料,对可能影响大肠癌术后的临床病理因素进行分析,以探讨这些因素病理因素对大肠癌术后的综合影响。

Zt

女二0,男二1

Z?

40=1,40、59二2,60~二3

组织学分类

z3

乳头状腺癌=0,管状腺癌二1

肿瘤大小(cm)

l\

6二0,其它二1

Dure'

s分期

z5

A二1,B=2,03,D二4

细胞增殖抗原(PCNA)

Z6

55%=0,55%=1

淋巴管侵润

z;

血管侵润

Zs

无二0,用二1

手术到观察结束

实际天数

结束时是否死亡

D

生存二0,死亡二1

2、研究天花粉注射治疗绒癌疗效的试验,将16只体表接种成功的裸鼠分为4组,其中一组作为对照,其余三组分别注射天花粉、甲药和乙药,得到如下数据:

试作Cox分析。

带瘤天数

天数

瘤体大小

天花粉治疗

无二0,有二1

甲药治疗

X.

无二0,有=1

乙药治疗

维生素

不用二0,用=1

生存天数

day

结局

生存=0,死亡=1

附例题:

文件名“sars'

建立永久数据集

libname1’d:

‘;

dataa;

set1.sars3;

run;

读出数据集,选择确诊和发烧病人

setal;

ifgroup=2thedelete;

逐步判别分析:

procstepdiscmethod二stepwisesle=0.05sls=0.05;

classgroup;

varcpnbentbhlnl2h5nlbinfabinfbbinfb2b

mpnbpivlbpiv3brsvnabrsvnbbsarslbsarslmtbsars2bsars3b;

Quit;

将逐步判别筛选出的变量作回代:

procdiscrim;

varh5nlbentbinfb2bsars2bsars3bmpnbsarslb;

*varinfb2bcpnbh5nlbpiv3brsvnbbsars3b;

quit;

计算疑似与发烧病人的逐步logistic回归:

datab;

ifgroup=lthedelete;

databl;

setb;

ifgroup=2thengroupn=l:

ifgroup=3thengroupn=0;

proclogisticdescending;

modelgroupn=cpnbentbhlnl2h5nlbinfabinfbbinfb2b

mpnbpivlbpiv3brsvnabrsvnbbsarslbsarslmtbsars2bsars3b/selection=stepwiseclodds=plsle=0.15sls=0.15;

*modelgroupn=cpnbentbhlnl2h5nlbinfabinfbbinfb2b

mpnbpivlbpiv3brsvnabrsvnbb

sarslbsarslmtbsars2bsars3b;

*modelgroupn=cpnbentbhlnl2h5nlbinfabinfbbinfb2b

mpnbpivlbpiv3brsvnabrsvnbb/selection=stepwiseclodds=pl

sle=0.15sls=0.15;

*/

quit;

计算确诊和发烧病人的logistics回归分析:

datac;

ifgroup=3thendelete;

setc;

ifgroup=lthengroupn=l:

ifgroup=2thengroupn=0;

*modelgroupn=cpnbentbhlnl2h5nlbinfabinfbbinfb2bmpnbpivlbpiv3brsvnabrsvnbb/selection=stepwiseclodds=plsle=0.15sls=0.15;

*,

 

1

BACKGROUND

274.5

140.5

4

SAMPLE]

疑似

296

1.078324

196

1.395018

2

5

SAMPLE2

209

1.487544

3

6

SAMPLE3

206

0.750455

195

1.3879

7

SAMPLE4

230

0.837887

223.5

1.590747

8

SAMPLES

240.5

0.876138

245.5

1.747331

9

SAMPLE6

251

0.91439

178

1.266904

10

SAMPLE7

224.5

0.817851

369.5

2.629893

11

SAMPLE8

确诊

390

1.420765

1.786477

12

SAMPLE9

219.5

0.799636

364

2.590747

13

SAMPLE10

228

0.830601

293

2.085409

Logistics(B类与C类病人拟和)

ClassificationTable

VariablesintheEquation

B

S.E・

Wald

Sig.

Exp(B

StepINFB21-3.6.585

39.835

.000・025

Predicti

Observed

TYPE

%

Step

45

40

52.9

22

106

82.8

OverallPercentagi

70.9

49

36

57.6

23

105

82.0

72.3

52

33

61.2

74.2

58

27

68.2

19

109

85.2

78.4

aThecutvalueis・500

Constai

4.41

・66E

44.859

.000

85.73

INFBE

-・T

・25£

9.056

.003

.461

INFB21

-3.7

.60]

38.555

.024

5.8(

.84(

47.784

331.5:

-1.1

・30£

13.998

・316

INFB2)

-4.0

•63£

40.996

.017

PIV1E

2.5(

•69?

13.938

13.31

3.2:

1.04

9.686

.002

25.50

-1.2

•32】

14.869

・290

-4・5

・69£

42.031

.011

2.9(

.73-

16.330

19.31

RSVNA1

2.31

.71(

10.812

.001

10.54

.97

1.24

.612

・434

2.64(

a

Variable(s)

enteredon

step1:

INFB2B・

b

step2:

INFBB.

c

step3:

PIV1B・

d

step4:

RSVNAB.

Logistics(疑似与发烧病人拟和)包括SARS病毒

Predici

TYPEPercentageCorrec

30

73.2

88

92.6

OverallPercentage

86.8

87.8

92

96.8

94.1

38

92.7

93

97.9

96.3

37

90.2

91

95.8

95.6

97.6

94

98.9

98.5

aThecutvalue

is・500

S.E.

Exp(B)

-8.810

1.529

33.179

10.449

1.746

35.812

34524.09

H5N1E

8.792

2.241

15.387

6582.40(

-12.319

2.360

27.254

・000

6.168

2.104

8.596

477.220

8.121

2.415

11.307

3364.19E

-13.139

2.863

21.065

PIV3E

5.558

2.055

7.312

.007

259.262

1.774

2.559

.480

・488

5.893

9.657

2.923

10.914

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 医药卫生 > 基础医学

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2