最经典数学建模Fisher模型.docx

上传人:b****6 文档编号:13654107 上传时间:2023-06-16 格式:DOCX 页数:20 大小:22.25KB
下载 相关 举报
最经典数学建模Fisher模型.docx_第1页
第1页 / 共20页
最经典数学建模Fisher模型.docx_第2页
第2页 / 共20页
最经典数学建模Fisher模型.docx_第3页
第3页 / 共20页
最经典数学建模Fisher模型.docx_第4页
第4页 / 共20页
最经典数学建模Fisher模型.docx_第5页
第5页 / 共20页
最经典数学建模Fisher模型.docx_第6页
第6页 / 共20页
最经典数学建模Fisher模型.docx_第7页
第7页 / 共20页
最经典数学建模Fisher模型.docx_第8页
第8页 / 共20页
最经典数学建模Fisher模型.docx_第9页
第9页 / 共20页
最经典数学建模Fisher模型.docx_第10页
第10页 / 共20页
最经典数学建模Fisher模型.docx_第11页
第11页 / 共20页
最经典数学建模Fisher模型.docx_第12页
第12页 / 共20页
最经典数学建模Fisher模型.docx_第13页
第13页 / 共20页
最经典数学建模Fisher模型.docx_第14页
第14页 / 共20页
最经典数学建模Fisher模型.docx_第15页
第15页 / 共20页
最经典数学建模Fisher模型.docx_第16页
第16页 / 共20页
最经典数学建模Fisher模型.docx_第17页
第17页 / 共20页
最经典数学建模Fisher模型.docx_第18页
第18页 / 共20页
最经典数学建模Fisher模型.docx_第19页
第19页 / 共20页
最经典数学建模Fisher模型.docx_第20页
第20页 / 共20页
亲,该文档总共20页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

最经典数学建模Fisher模型.docx

《最经典数学建模Fisher模型.docx》由会员分享,可在线阅读,更多相关《最经典数学建模Fisher模型.docx(20页珍藏版)》请在冰点文库上搜索。

最经典数学建模Fisher模型.docx

最经典数学建模Fisher模型

疾病诊断问题

疾病诊断问题

摘要

文中研究的是通过已给出的数据对其四项生化指标:

血清铜蓝蛋白(Xi)、蓝

色反应(X2)、鸟吲哚乙酸(*)、中型硫化物(X4)进行分析,得出健康综合指数的临界值,从而协助医生诊断就诊人员是癌症病人还是萎缩性胃炎病人及健康人。

首先,在合理的假设下,建立了Fisher判别分析模型,将表中的数据分为A,B,C三组,由其各自的离差矩阵求得每种指标对应的权重,并得到了健康综合指数的临界值,经过检验,用此模型诊断的正确率为100%

此外,文中对所建立的模型做了检验,误差分析和评价,并将此模型做了推广和应用。

关键词

综合指数临界值权重Fisher判别分析

一、问题重述

胃癌患者容易被误诊为萎缩性胃炎患者或非胃病者,据此,通常要化验人体

内四项生化指标:

血清铜蓝蛋白(Xi)、蓝色反应(X2)、鸟吲哚乙酸(X3)、中型硫化物(X4),从而用这些指标协助医生诊断。

表中1-5号病例是已经确诊为胃癌

的病人的化验结果;6-10号病例是已经确定为萎缩性胃炎病人的化验结果;11-15是已经确诊为健康人的化验结果。

血清铜蓝蛋白X1

蓝色反应X2

尿吲哚乙酸X3

中性硫化物X4

1

228

134

0.2

0.11

2

245

134

0.1

0.4

3

200

167

0.12

0.27

4

170

150

0.07

0.08

5

100

167

0.20

0.14

6

255

125

0.07

0.14

7

130

100

0.06

0.12

8

150

117

0.07

0.06

9

120

133

0.1

0.26

10

160

100

0.05

0.10

11

185

115

0.05

0.19

12

170

125

0.06

0.04

13

165

142

0.05

0.08

14

135

108

0.02

0.12

15

100

117

0.07

0.02

根据表中的数据,设想使用Fisher判别分析法,给出鉴别胃病的方法并对所给的数据进行检验,使问题得到有效的解决。

二、问题分析

医生在诊断就诊人员是癌症病人还是萎缩性胃炎病人及健康人。

通常要化验

人体内四项生化指标,从而用这些指标协助诊断。

由表中看出医生通常用血清铜蓝蛋白(X1)、蓝色反应(X2)、鸟吲哚乙酸(X3)、中型硫化物(X4)在人体内的含量作为指标进行诊断。

要判断就诊人员是i胃癌病人还是ii萎缩性胃炎病人及iii健康人,分别对①

胃癌患者与非胃病者及②萎缩性胃炎患者与非胃病者以及③胃癌患者与萎缩性胃炎患者进行分析,分别得出其相对应的健康综合指数的临界值(H,H2,H3)

作为判别标准,这是一个判别分析问题。

通过表中的数据分析可得:

如果就诊人员在情况①下由临界值H1判断为胃癌,则在第三种情况下分析,如果由临界值H3判断为胃癌,则认为此人患有胃癌;如果判断为萎缩性胃炎,则此人为萎缩性

胃炎患者。

如果在情况①下由临界值H1判断为非胃病者,则在第二种情况下分析,如果由临界值H2判断为非胃病者,则此人为非胃病者;若判断为萎缩性胃炎,则此人为萎缩性胃炎患者。

要得到就诊人员的健康综合指数,就必须通过表中的数据得到人体内四项生化指标含量的一个权值(这个权值是恒定的)。

由于各年龄阶段人体内各种生化指标的含量是不同的,要使这个临界值更加准确,就必须消除年龄和体质的差异,所以所抽取样本应该是随机的,且这个随机样本中就诊人员没有其他病症。

为了使医生诊断的结果准确,建立Fisher判别分析模型,确定健康综合指数的临界值和人体内四项生化指标含量的权值。

将此权值代入表中进行检验,并计算此模型诊断结果的正确率。

三、模型假设及符号说明

1模型假设

(1)表中的数据是随机抽取的化验结果,具有普遍性;

(2)就诊人员没有其他病症,且化验当天没有特殊情况;

(3)化验仪器足够精确;

(4)除了表中列出的指标外,其它指标对是否患胃癌的影响很小。

(5)检测是在同等条件下进行的,即同样的外界环境和生理条件。

2符号说明

H:

就诊人员健康综合指数的临界值;

Hi:

第i个就诊人员的综合指数;

Cj:

第i个就诊人员第j个指标的权值;

州:

第i个就诊人员第j个指标的含量;

Xj:

第j个指标含量的平均值;

H:

就诊人员综合指数的平均值。

四、模型建立

模型Fisher判别分析模型

通常是由化验结果中X,化X,X4四种元素作为诊断指标,医生最终要诊断就诊人员是癌症病人还是萎缩性胃炎病人及健康人,就必须确定一个健康综合指数的临界值作为判别标准,因此这是一个判别分析问题。

故建立Fisher判别分析模型

4

Hi八qXji=M,51

j丑

将Hi与健康综合指数的临界值作比较,就可诊断就诊人员是癌症病人还是萎缩性胃炎病人及健康人。

要得到就诊人员的健康综合指数,就必须通过表中的数据得到人体内四种元素含量的一个权值Cj(这个权值是恒定的)。

为了求得Cj,利用Fisher判别准则[2]:

由于表中1-5号病例确诊为胃癌患者,6-10号病例确诊为萎缩性胃炎患者,

11-15号病例确诊为非胃病者,故将表中的就诊人员分为

0000

非胃病者,B组为胃癌患者,乜1组为萎缩性胃炎患者

A组数据矩阵为

A,B,

C三组:

A组为

B组数据矩阵为

C组数据矩阵为

w0

w1

w2

0

X21

M

.10

,,rQj、

00

X23X

MM

00

XI53X1

X13X4

XX233XX

Mx22Mx

XM53xM

53X54

L,4

0

x22

M

0

X12

X12

M#

xM?

2

X52

X0

lj

xx;2

XM2

1

X5lVI

ipxj

j5y

_1_1JX1

XjXij

251仁2

XjXj

5y

2

15

44

2

24

4

作出AB,C三组的离差矩阵「X,0-乂

=1,L,4

=1,L,4

0

X14X

则G

M(S1)」

(11)6」

N0

..15Ha5Hb

H

10

其中

1

-X1

M

~1

_X4

I理上O0hl%;L_

IMO

_X51-X1L

M(S2)

L叭;

2121

XX45丁XX

22

X54-X4

X4-X4

10

[

12I

X^-X11

M

=(s3)」

M

11

12

X4—X4

庄=$十齐E'E严斗亍二迅+S]

..25Ha5Hl

H-

10

10

11

忆丿、H|,模型求解

123

由2式求得H=-4.9149,H=1.1364,H=3.5551,

病例号

1

2

3

4

5

表1-15号病例健康状况的综合指数

 

综合指数H0

-5.9225

-5.7190

-6.1765

-4.9491

-6.0543

综合指数H2

4.1222

3.8402

4.3695

3.7157

4.3193

病历号

6

7

8

9

10

综合指数H1

0.6134

0.7392

0.9614

0.6689

0.8465

综合指数H2

3.5402

2.5976

3.0171

3.3716

2.6570

病历号

11

12

13

14

16

综合指数H0

-4.2580

-4.2413

-4.5897

-3.4987

-3.7394

综合指数H1

1.0631

1.3429

2.0362

1.8544

1.2373

为了使医生对就诊人员的健康状况做一个更加准确的诊断,由Fisher模型

求得就诊人员健康状况的综合指数。

要得到就诊人员健康状况的综合指数,由1知,首先必须得到每一个指标

对应的权重Cj(j=1丄,7),利用Fisher判别准则:

先将病历号1-15分为代B,C三组(A表示非胃病者,B表示胃癌患者,C表示萎缩性胃炎患者)

A组数据矩阵

B组数据矩阵丨"0H7価0理

WOU7020

C组数据矩阵

11^01000.0501。

由567通过Excel分别求得A组与B组及C组数据每一列的平均值,如表2表2非胃病组A与胃癌组B及萎缩性胃炎组C的数据矩阵每一列的平均值

0

0

0

0

x1

X2

X3

X4

151

121.4

0.05

0.09

1

1

1

1

X1

X2

X3

X4

188.6

150.4

0.138

0.2

2

2

2

2

X1

X2

X3

X4

163

115

0.07

0.136

由矩阵8910分别求得A组与B组及C组数据的离差矩阵A、B、C(见附录)

且由A、B、C得

根据11式有MATLA求得

M=(S2)

52

340207

905895fu1

6106

1

xi_X1

IM—0—"-0.00

x^-x4H_

001

3.9

0.1

健康综合指数临界值

10—10

其中Ha4.0654Hb5.7643He=0.7659

_CiI

M

即4」

(s1)」

2-J

u2

X4X4

■cj

M=(S3)

C1,C2,G

T

C1,C2,03,C4-

C1,C2,C3

捲一为I

|M

-1^0^0047X4

T

0X40-284

—22.7869

1.0210

..15Ha5Hb..25Ha5Hc「3

HHH

5H「5Hb

10

Ha=1.5068H^4.0734Hc=3.0367

123

H1=-4.9149,H2=1.1364,H3=3.5551

将(g,C2,q,C4T分别代入A,B,C三组数据中用Fisher模型进行经检验,将B组数据代入情况1中分析检验的结果是:

B组数据的Hi°均小于H1,则他们是癌症患者,再代入情况3中分析H?

均大于H则肯定他们是癌症患者,诊断的正确率为100%。

对A组数据分析:

Hi°均大于H1,则他们是非胃病者,再代入情况2中分析H1均大于『则肯定他们是非胃病者,诊断的正确率为100%对C

组数据分析代入情况1中分析出结果不确定,则代入情况2或情况3中分析,都得出他们是萎缩性胃炎患者,则肯定他们是萎缩性胃炎患者,诊断的正确率为

100%对A,B,C三组数据的就诊人员总诊断的正确率为100%

六、模型检验及误差分析

1、模型检验

将表中确诊病例的化验结果代入我们所建立的模型中,得到的结论分别是

1-5号病例确诊为胃癌患者,6-10号病例确诊为萎缩性胃炎患者,11-15号病例确诊为非胃病者,诊断的正确率分别为100%100%、100沦个概率说明我们所建立的模型能应用到实际生活中。

2、误差分析

(1)模型误差

表中给出确诊病例的化验结果只有15人,由于数据有限,不能很准确的代表普遍情况。

因此我们所建立的模型中判断的综合指数是有误差的。

样,用模型所检验的准确率就达不到100%。

(2)舍入误差

在模型的建立过程中,由于数据复杂,我们通过四舍五入的方法来处理数据,这样得到健康人的综合指数是有误差的。

七、模型评价与改进

优点:

1.分析了由Fisher判别法得到的结果用来检验所给的15组数据,得出诊断的正确率为100%这说明我们所建立的模型具有实际意义。

2.当实验数据非常多时,传统的方法就不再适用了,只能转而使用数值计算的相关理论,以发现数据中存在的关联和规则,此时该模型就具有非常强的实用性。

缺点:

文中假设就诊人员的病例是随机抽取的,而人在各年龄阶段体内元素的含量

存在差异,故会出现误诊情况。

改进:

1.在一级甲等医院随机抽取大量确诊为癌症病人还是萎缩性胃炎病人及健康人的化验结果,从而使我们所使用的数据所确定的健康综合指数临界值够精确;

2.由于人体内四项生化指标含量在人体内是分布不均匀的,通过医学常识准掌

握人体内四项生化指标含量分布情况,进而对模型加以改进,使得对胃病检

验的准确率提高。

参考文献

["http:

//zh.wikipedia.org/wiki/%E8%B4%A8%E5%BF%83

[2]阮晓青,周义仓,数学建模引论,高等教育出版社,2005年7月

⑶盛骤,谢式千,潘承毅,概率论与数理统计(第三版),高等教育出版社,2001年12月

[4]宋来忠,王志明,数学建模与实验,科学出版社,2005年8月

[5]

附录

B=[228-188.6,134-150.4,0.2-0.138,0.11-0.2;245-188.6,134-150.4,0.1-0.138,0.4-0.2;200-188.6,167-150.4,0.12-0.138,0.27-0.2;170-188.6,150-150.4,0.07-0.138,0.08-0.2;100-188.6,167-150.4,0.20-0.138,0.14-0.2]

B=

56.4000

-16.4000

-0.0380

0.2000

11.4000

16.6000

-0.0180

0.0700

-18.6000

-0.4000

-0.0680

-0.1200

-88.6000

16.6000

0.0620

-0.0600

39.4000-16.4000

0.0620-0.0900

>>B1=B'*B

B1=

1.0e+004*

1.3059

-0.2845

-0.0004

0.0016

-0.2845

0.1089

0.0000

-0.0002

-0.0004

0.0000

0.0000

-0.0000

0.0016

-0.0002

-0.0000

0.0000

>>

C=[255-163,125-115,0.07-0.07,0.14-0.136;130-163,100-115,0.06-0.07,0.12-0.136;150-163,117-11

5,0.07-0.07,0.06-0.136;120-163,133-115,0.1-0.07,0.26-0.136;160-163,100-115,0.05-0.07,0.10-0.1

36]

C=

92.0000

-33.0000

-13.0000

-43.0000

-3.0000

10.0000

-15.0000

2.0000

18.0000

-15.0000

0

-0.0100

0

0.0300

-0.0200

0.0040

-0.0160

-0.0760

0.1240

-0.0360

>>6=C'*C

C1=

1.0e+004*

1.1580

0.0660

-0.0001

-0.0003

0.0660

0.0878

0.0001

0.0003

-0.0001

0.0001

0.0000

0.0000

-0.0003

0.0003

0.0000

0.0000

>>S3=B1+C1

S3=

1.0e+004*

2.4639

-0.2185

-0.0005

0.0013

-0.2185

0.1967

0.0001

0.0001

-0.0005

0.0001

0.0000

-0.0000

0.0013

0.0001

-0.0000

0.0000

>>B=[188.6-163,150.4-115,0.138-0.07,0.2-0.136]

B=

25.600035.40000.06800.0640

>>S=inv(S3)*B'

S=

0.0034

0.0190

3.9082

0.1760

>>D仁[228,134,0.2,0.11]

D1=

 

228.0000134.00000.2000

0.1100

 

 

>>D2=[245,134,0.1,0.4]

D2=

245.0000134.00000.1000

0.4000

 

>>D3=[200,167,0.12,0.27]

D3=

200.0000167.00000.1200

0.2700

 

>>D4=[170,150,0.07,0.08]

D4=

170.0000150.00000.0700

0.0800

 

>>D5=[100,167,0.2,0.14]

D5=

100.0000167.00000.2000

0.1400

 

>>S=[0.0034,0.0190,3.9082,0.1760]

S=

0.0034

0.0190

3.9082

0.1760

 

>>S仁S*D1'

51=

4.1222

>>S2=S*D2'

52=

3.8402

>>S3=S*D3'

53=

4.3695

>>S4=S*D4'

54=

3.7157

>>S5=S*D5'

55=

4.3193

>>S=(S1+S2+S3+S4+S5)/5

S=

4.0734

>>E仁[255,125,0.07,0.14]

E1=

255.0000125.00000.0700

>>E2=[130,100,0.06,0.12]

E2=

130.0000100.00000.0600

>>E3=[150,117,0.07,0.06]

E3=

150.0000117.00000.0700

>>E4=[120,133,0.1,0.26]

E4=

120.0000133.00000.1000

>>E5=[160,100,0.05,0.10]

E5=

160.0000100.00000.0500

>>S=[0.0034,0.0190,3.9082,0.1760]

0.1400

0.1200

0.0600

0.2600

0.1000

 

0.1760

0.00340.01903.9082

>>S仁S*E1'

51=

3.5402

>>S2=S*E2'

52=

2.5976

>>S3=S*E3'

53=

3.0171

>>S4=S*E4'

54=

3.3716

>>S5=S*E5'

55=

2.6570

>>S=(S1+S2+S3+S4+S5)/5

3.0367

>>(3.0367+4.0734)/2ans=

3.5551

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > IT计算机 > 电脑基础知识

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2