数模论文.docx

上传人:b****1 文档编号:10234822 上传时间:2023-05-24 格式:DOCX 页数:26 大小:252.02KB
下载 相关 举报
数模论文.docx_第1页
第1页 / 共26页
数模论文.docx_第2页
第2页 / 共26页
数模论文.docx_第3页
第3页 / 共26页
数模论文.docx_第4页
第4页 / 共26页
数模论文.docx_第5页
第5页 / 共26页
数模论文.docx_第6页
第6页 / 共26页
数模论文.docx_第7页
第7页 / 共26页
数模论文.docx_第8页
第8页 / 共26页
数模论文.docx_第9页
第9页 / 共26页
数模论文.docx_第10页
第10页 / 共26页
数模论文.docx_第11页
第11页 / 共26页
数模论文.docx_第12页
第12页 / 共26页
数模论文.docx_第13页
第13页 / 共26页
数模论文.docx_第14页
第14页 / 共26页
数模论文.docx_第15页
第15页 / 共26页
数模论文.docx_第16页
第16页 / 共26页
数模论文.docx_第17页
第17页 / 共26页
数模论文.docx_第18页
第18页 / 共26页
数模论文.docx_第19页
第19页 / 共26页
数模论文.docx_第20页
第20页 / 共26页
亲,该文档总共26页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

数模论文.docx

《数模论文.docx》由会员分享,可在线阅读,更多相关《数模论文.docx(26页珍藏版)》请在冰点文库上搜索。

数模论文.docx

数模论文

数模论文

一、问题重述:

病人到医院检查肾炎时,需要通过检查若干项指标。

我们需要建立模型找出各项指标与病人健康状况之间的关系。

现在已知90个人的各项检查指标,其中1-30为肾炎患者,31-60为健康人,61-90为待测病例。

我们需要解决以下问题:

问题一、提出一种或多种简便的判别方法,判别属于患者或健康人,并检验所提出方法的正确性。

问题二、按照1提出的方法,对30名待测病例的化验结果进行判别,判定他(她)们是肾炎病人还是健康人。

问题三、根据已知结果的60名确诊者的指标,确定哪些指标是影响人们患肾炎的关键或主要因素,以便减少化验的指标。

问题四、根据3中所得到的主要影响指标根据30名待测病例的化验结果重新进行诊断。

并对2、4的结果作进一步分析。

二、基本假设:

1.假设个别有误差病例对模型的影响可以忽略。

2.健康者和患者两类人群的Zn、Cu、Fe、Ca、Mg、K、Na等的七项指标的期望值、标准差、相关系数、与有数据给出的样本的统计量一致,且服从正态分布。

3.假设所给样本真实精确,并足以概括普通就医者的身体状况。

4.肾炎的诊断结果只由所给出的七项指标所决定。

5.人体内各项指标不随时产生较大幅度的波动。

6.忽略个体之间的性别,年龄等差异。

7.就诊者之间的其他身体状况无显著差异,可以忽略。

 

三、符号说明:

表3.1基本符号说明

P

误差率,错误个数与样本容量的比值

结果矩阵(i=1,2)

Spss软件得出的系数矩阵(i=0,1…7)

因子矩阵(i=0,1…7)

Spss软件得出的系数矩阵(i=0,1…7)

C

判断矩阵

旋转因子得分表达式(i=1,2)

因子矩阵(i=0,1…7)

Zi

特征向量(i=1,2)

 

四、模型的建立与求解:

4.1问题一的建模与求解:

问题分析:

问题

(1)要求我们提出一种或多种简便的判别方法,判别属于患者或健康人的方法,并检验所提出方法的正确性。

对于该类根据操作数据拟合和预测的问题,BP神经网络和贝叶斯判别分析法都是常用的方法。

本文中我们用这两种方法分别建立模型,并加以比较分析,得到较为精确的表达式。

4.1.1BP神经网络模型

1.首先建立BP神经网络模型。

a)BP神经网络方法的思想:

基于误差反向传播算法的多层前馈网络,是目前应用最成功和广泛的人工神经网络,它基于信息的正向传播和误差的反向回馈来训练整个BP神经网络,使得输出层误差的平方和达到最小。

神经网络是单个并行处理元素的集合,我们从生物学神经系统得到启发。

在自然界,网络功能主要有神经节决定,我们可以通过改变连接点的权重来训练神经网络完成特定的功能。

一般的神经网络都是可调节的,或者说可训练的,这样一个特定的输入便可得到要求的输出。

基本结构如下图所示:

图4.1.1BP神经网络基本结构图

b)根据题设,建立BP神经网络模型:

在研究肾炎患者的问题中,以表1中20名健康人和20名肾炎患者作为样本,对样本进行0-1规划,以0表示健康人,以1表示肾炎患者,利用MATLAB软件对BP神经网络进行编程求解,并对剩下的10名健康人和10名肾炎患者进行了判定检验。

以下是我们应用BP神经网络方法的具体思路:

 

图4.1.2BP神经网络模型建立过程示意图

P=错误个数/检验样本数

2.模型的求解。

a)利用matlab中的神经网络工具箱可以对建立的网络进行训练。

人工智能网络是一智能系统,学习能力是它最具吸引力的特点,而学习的过程就是训练的过程。

训练的一种方式是批处理方式,它由函数train触发。

在批处理方式中,当整个训练设置被应用到网络后权重和偏执才被更新。

在每一个训练例子中的计算的梯度加在一起来决定权重和偏置的变化。

我们采用trainscg的算法即Scaled共轭梯度法,好处在于训练不收敛时会自动停止训练,耗时少;而且TrainParameters输入不多,也不用太多的技巧调整,一般指定迭代次数、结果显示频率和目标误差就可以了。

得到的训练图象:

图4.1.3人工神经网络训练图像

具体程序代码如下

net=newff(minmax(P),[7,7,7,7,7,7,1],{'tansig','tansig','tansig','tansig','tansig','tansig','purelin'},'trainscg');

net.trainParam.lr=0.05;

>>net.trainParam.epochs=300;

>>net.trainParam.goal=1e-3;

>>[net,tr]=train(net,P,T)

 

b)模型求解结果

表4.1.1校验结果与真实值比照表

病历号

目标输出

检验结果

真实值

真实结果

21

0.9926

肾炎

1

肾炎

22

0.94

肾炎

1

肾炎

23

0.9934

肾炎

1

肾炎

24

1.2529

肾炎

1

肾炎

25

0.8814

肾炎

1

肾炎

26

0.9664

肾炎

1

肾炎

27

0.8708

肾炎

1

肾炎

28

0.9612

肾炎

1

肾炎

29

0.9515

肾炎

1

肾炎

30

0.9835

肾炎

1

肾炎

51

0.0319

健康

0

健康

52

0.0254

健康

0

健康

53

0.0725

健康

0

健康

54

0.3648

健康

0

健康

55

0.0692

健康

0

健康

56

0.0488

健康

0

健康

57

0.0662

健康

0

健康

58

0.0714

健康

0

健康

59

0.0814

健康

0

健康

60

-1.4246

健康

0

健康

误差率P=0

 

4.1.2贝叶斯判别模型

a)贝叶斯判别方法思想:

贝叶斯判别方法是把先验信息与样本信息结合起来形成后验信息,再使用后验信息进行推断,形成质量分类判别的一种统计方法,它在各总体类以不同的概率出现时,优先考虑的是判断出概率大的质量类,较好地解决了分类问题,同时它克服了各个总体各自出现的概率大小完全无关及与错判之后造成的损失无关这些不足。

b)根据题设,建立贝叶斯判别模型

用1-20,,31-50这四十组数据作为判别模型的基础数据,经过spss的数据处理,得到贝叶斯判别函数形式如下:

病人:

(其中

为列矩阵)

健康:

(其中

为用spss得出的系数)

c)判别:

将21-30,51-60作为检验项进行模型检验,应用mathlab矩阵实现

(其中

均为列矩阵)

i.若C中某一行大于0,则说明这一行对应的人属于

(病人);

ii.若C中某一行小于0,则说明这一行对应的人属于

(健康者)

d)将已知结果与真实结果作比较,得出失误率P

以下使我们应用贝叶斯判别法的具体思路:

 

 

 

图4-1-1贝叶斯判别模型建立过程示意图

 

模型求解结果详见下表:

表4.1.2校验结果与真实值比较

病历号

C值

真实值

检验结果

真实结果

21

4.4026

+

肾炎

肾炎

22

4.3479

+

肾炎

肾炎

23

0.3287

+

肾炎

肾炎

24

2.1766

+

肾炎

肾炎

25

0.0042

+

肾炎

肾炎

26

4.3847

+

肾炎

肾炎

27

1.863

+

肾炎

肾炎

28

4.6235

+

肾炎

肾炎

29

1.9682

+

肾炎

肾炎

30

3.6844

+

肾炎

肾炎

51

-7.8723

-

健康

健康

52

-2.3988

-

健康

健康

53

-2.1181

-

健康

健康

54

-3.0379

-

健康

健康

55

-10.1296

-

健康

健康

56

-7.7972

-

健康

健康

57

-9.3775

-

健康

健康

58

-4.4084

-

健康

健康

59

-3.3742

-

健康

健康

60

-0.0147

-

健康

健康

(P为失误率)

4.2问题二的建模与求解

我们通过对问题一的研究建分别立了BP神经网络模型和贝叶斯判别模型,下面我们分别应用以上两个模型对61-90这30名待测病例进行肾炎分析,得到一定的结果,最后我们将两个模型的求解结果进行了比较和分析。

4.2.1BP神经网络模型

我们应用4.1.1中建立的BP神经网络模型,通过将61-90这30组数据代入该模型中得到了这30组待测病例的可能诊断结果。

具体结果见下表:

表4.1.330名待测病例应用BP神经网络模型得出的诊断结果

病历号

输出结果

真值

诊断结果

61

1.1559

1

肾炎

62

0.8879

1

肾炎

63

0.911

1

肾炎

64

1.331

1

肾炎

65

1.2544

1

肾炎

66

0.8281

1

肾炎

67

0.9697

1

肾炎

68

1.0451

1

肾炎

69

1.1216

1

肾炎

70

0.0255

0

健康

71

0.3823

0

健康

72

0.9689

1

肾炎

73

1.2036

1

肾炎

74

0.0028

0

健康

75

0.0276

0

健康

76

1.0571

1

肾炎

77

0.1127

0

健康

78

-0.0424

0

健康

79

0.1897

0

健康

80

0.0556

0

健康

81

0.1153

0

健康

82

0.0371

0

健康

83

1.0142

1

肾炎

84

0.0364

0

健康

85

1.1151

1

肾炎

86

-0.0756

0

健康

87

0.923

1

肾炎

88

0.0357

0

健康

89

0.0882

0

健康

90

-0.1001

0

健康

4.2.2贝叶斯判断模型:

我们应用4.1.2中建立的贝叶斯判断模型,通过将61-90这30组数据代入该模型中得到了这30组待测病例的可能诊断结果。

具体诊断结果见下表:

表4.1.330名待测病例应用贝叶斯判断模型得出的诊断结果

病历号

C值

真值

诊断结果

61

2.4126

+

肾炎

62

0.2842

+

肾炎

63

0.9519

+

肾炎

64

3.2775

+

肾炎

65

0.7716

+

肾炎

66

0.688

+

肾炎

67

-2.296

-

健康

68

0.9238

+

肾炎

69

1.6987

+

肾炎

70

-3.9959

-

健康

71

-0.69

-

健康

72

3.411

+

肾炎

73

2.6173

+

肾炎

74

-2.3191

-

健康

75

-0.3595

-

健康

76

2.1755

+

肾炎

77

-1.6774

-

健康

78

-1.7214

-

健康

79

-1.2992

-

健康

80

-5.0862

-

健康

81

-7.3656

-

健康

82

-4.5714

-

健康

83

4.0323

+

肾炎

84

-2.1921

-

健康

85

2.8401

+

肾炎

86

-3.6823

-

健康

87

0.1114

+

肾炎

88

-6.9667

-

健康

89

-13.9942

-

健康

90

-1.7491

-

健康

4.2.3两种模型所得结果的综合比较

我们将将分别应用两种模型所得到的诊断结果放在如下表中进行比较:

表4.2.430应用两种模型所得诊断结果比较表

病历号

BP模型诊断结果

贝叶斯模型诊断结果

诊断结果差异

61

肾炎

肾炎

62

肾炎

肾炎

63

肾炎

肾炎

64

肾炎

肾炎

65

肾炎

肾炎

66

肾炎

健康

67

肾炎

健康

×

68

肾炎

肾炎

69

肾炎

肾炎

70

健康

健康

71

健康

健康

72

肾炎

肾炎

73

肾炎

肾炎

74

健康

健康

75

健康

健康

76

肾炎

肾炎

77

健康

健康

78

健康

健康

79

健康

健康

80

健康

健康

81

健康

健康

82

健康

健康

83

肾炎

肾炎

84

健康

健康

85

肾炎

肾炎

86

健康

健康

87

肾炎

肾炎

88

健康

健康

89

健康

健康

90

健康

健康

差异率P=3.3%

(“√”表示结果一致,“×”表示结果不一致)

4.2.4两种模型的比较分析

BP神经网络和贝叶斯判别法比较

相对于贝叶斯判别模型,BP神经网络模型判定是否患病的准确率更高,这是因为贝叶斯判别方法是吧先验信息与样本信息结合起来形成后验信息,再使用后验概率进行推断,形成质量分类判别的一种统计方法,大他却忽略了各协变量之间可能存在相关关系,也因此导致了结果出现了一定的误差。

由于BP神经网络有模拟推理与自动学习性,更接近于自组织和并行处理能力,使其具有一定的智能性,并且BP神经网络模型仿真性能好,所以使得它在建模判定方面的能力由于其他方法。

BP神经网络和贝叶斯判别法各自优点

贝叶斯判别方法是把先验信息与样本信息结合起来形成后验信息,再使用后验信息进行推断,形成质量分类判别的一种统计方法,它在各总体类以不同的概率出现时,优先考虑的是判断出概率大的质量类,较好地解决了分类问题,同时它克服了各个总体各自出现的概率大小完全无关及与错判之后造成的损失无关这些不足。

BP神经网络实质上实现了一个从输入到输出的映射功能,而数学理论已证明它具有实现任何复杂非线性映射的功能。

这使得它特别适合于求解内部机制复杂的问题;同时,BP网络能通过学习带正确答案的实例集自动提取“合理的”求解规则,即具有自学习能力。

4.3问题三的建模与求解

问题分析:

问题三要求我们根据已知结果的60名确诊者的指标,确定肾炎诊断的关键因素,我们可以应用主成分分析法和逐项回归的方法得出结论。

4.3.1主成分分析法

a)主成分分析法思想:

主成分分析是设法将原来众多具有一定相关性(比如P个指标),重新组合成一组新的互相无关的综合指标来代替原来的指标。

通常数学上的处理就是将原来P个指标作线性组合,作为新的综合指标。

最经典的做法就是用F1(选取的第一个线性组合,即第一个综合指标)的方差来表达,即Var(F1)越大,表示F1包含的信息越多。

因此在所有的线性组合中选取的F1应该是方差最大的,故称F1为第一主成分。

如果第一主成分不足以代表原来P个指标的信息,再考虑选取F2即选第二个线性组合,为了有效地反映原来信息,F1已有的信息就不需要再出现再F2中,用数学语言表达就是要求Cov(F1,F2)=0,则称F2为第二主成分,依此类推可以构造出第三、第四,……,第P个主成分。

F2=a12ZX1+a22ZX2……+ap2ZXp

……

Fp=a1mZX1+a2mZX2+……+apmZXp

其中a1i,a2i,……,api(i=1,……,m)为X的协方差阵Σ的特征值多对应的特征向量,ZX1,ZX2,……,ZXp是原始变量经过标准化处理的值,因为在实际应用中,往往存在指标的量纲不同,所以在计算之前须先消除量纲的影响,而将原始数据标准化,本文所采用的数据就存在量纲影响[注:

本文指的数据标准化是指Z标准化]。

A=(aij)p×m=(a1,a2,…am,),Rai=λiai,R为相关系数矩阵,λi、ai是相应的特征值和单位特征向量,λ1≥λ2≥…≥λp≥0。

进行主成分分析主要步骤如下:

1.  指标数据标准化(SPSS软件自动执行);

2.  指标之间的相关性判定;

3.  确定主成分个数m;

4.  主成分Fi表达式;

5.  主成分Fi命名;

主成分与综合主成分(评价)值。

a)建模过程:

i.应用spss做主成分分析,将1-60这60组数据代入得到:

特征根与方差贡献率,可以看到前两项贡献率已超过70%;

因子得分系数矩阵

ii.根据得分系数矩阵,得到旋转因子得分表达式:

为主成分析之中的主因子)

iii.综合考虑

,看

中系数较大的几项指标

,看

中系数较大的几项指标

所以

就是主成分。

b)根据以上建立的模型,求得相关结果如下:

表4.3.1七项指标特征向量

七项指标

特征向量矩阵

Z1

Z2

`0.256

-0.383

0.481

0.209

0.386

0.139

0.508

-0.036

0.532

0.070

-0.117

0.609

-0.003

0.644

所得主成分表达式为:

的最大权重系数0.508,0.532分别对应Ca,Mg;

的最大权重系数0.609,0.644分别对应K,Na

故K、Na、Ca、Mg为关键因素。

4.3.2逐项回归法

a)逐项回归法基本思想:

题目要求我们找出导致肾炎的关键指标,我们可以运用逐步回归的思想得出结论。

在实际问题中,人们总是希望从对因变量有影响的诸多变量中选择一些变量作为自变量,应用多元回归分析的方法建立“最优”回归方程以便对因变量进行预报或控制。

所谓“最优”回归方程,主要是指希望在回归方程中包含所有对因变量影响显著的自变量而不包含对影响不显著的自变量的回归方程。

逐步回归分析正是根据这种原则提出来的一种回归分析方法。

它的主要思路是在考虑的全部自变量中按其对的作用大小,显著程度大小或者说贡献大小,由大到小地逐个引入回归方程,而对那些对作用不显著的变量可能始终不被引人回归方程。

另外,己被引人回归方程的变量在引入新变量后也可能失去重要性,而需要从回归方程中剔除出去。

引人一个变量或者从回归方程中剔除一个变量都称为逐步回归的一步,每一步都要进行检验,以保证在引人新变量前回归方程中只含有对影响显著的变量,而不显著的变量已被剔除。

逐步回归分析的实施过程是每一步都要对已引入回归方程的变量计算其偏回归平方和(即贡献),然后选一个偏回归平方和最小的变量,在预先给定的水平下进行显著性检验,如果显著则该变量不必从回归方程中剔除,,这时方程中其它的几个变量也都不需要剔除(因为其它的几个变量的偏回归平方和都大于最小的一个更不需要剔除)。

相反,如果不显著,则该变量要剔除,然后按偏回归平方和由小到大地依次对方程中其它变量进行检验[4]。

将对影响不显著的变量全部剔除,保留的都是显著的。

接着再对未引人回归方程中的变量分别计算其偏回归平方和,并选其中偏回归平方和最大的一个变量,同样在给定水平下作显著性检验,如果显著则将该变量引入回归方程,这一过程一直继续下去,直到在回归方程中的变量都不能剔除而又无新变量可以引入时为止,这时逐步回归过程结束。

逐步回归的思想虽然容易理解,但骑分析过程及计算步骤书写起来比较麻烦,我们用Matlab工具箱中的逐步回命令(Stepwise)来实现这一思想。

主要可以通过下面的命令来实现:

Stepwise(x,y,inmodel,alpha),

其中,x是自变量数据,排成60×7的矩阵(60表示样本自变量个数,n为每个变量的数据量);y是因变量数据,排成60×1阶数据矩阵;inmodel是自变量初始集合的指标(即矩阵x中哪些列进入初始集合),缺省时为空;alpha为显著性水平,缺省时可设为0.05。

b)我们应用这种模型得到结果如下:

图4.3.1matlab下stepwiseTable和stepwisePlot窗口结果显示

经过分析判别,移入相应的元素,得到最后的结果如下:

图4.3.2肾炎最终结果显示

易知,影响显著的自变量为:

X2、X3、X4、X7,其回归系数为:

B2=0.0113、B3=-0.0018、B4=-0.0003、B7=0.0004,常数项B0=0.7524

利用逐步回归,最终得到的模型为:

Y=0.0113X2-0.0018x3-0.0003x4+0.0004x7+0.7542

所以,决定就诊者是否为患者的主要指标为:

Cu、Fe、Ga、Na

4.4问题四的模型建立与求解

问题分析:

问题四需要我们根据4.3中求得的关键因素对样本进行重新诊断,我们采用4.1中的方法对样本进行再次诊断,并得到两种模型求解下的差异。

我们分别应用4.1.1中的BP神经网络模型和贝叶斯模型,我们求解了在只考虑四项关键因素情况下的未知病例的肾炎诊断结果,详见下表:

a)前后两次模型检验结果对比表:

 

表4.4.1两种模型检验结果对照表

病例号

BP神经网络第二次诊断

贝叶斯第二次诊断

诊断结果

实际比较

诊断结果

实际比较

21

肾炎

肾炎

22

肾炎

肾炎

23

肾炎

健康

错误

24

肾炎

肾炎

25

肾炎

健康

错误

26

肾炎

肾炎

27

健康

错误

肾炎

28

肾炎

肾炎

29

肾炎

肾炎

30

肾炎

健康

错误

51

健康

健康

52

健康

健康

53

健康

健康

54

健康

健康

55

健康

健康

56

健康

健康

57

健康

健康

58

健康

健康

59

健康

健康

60

健康

健康

P=5%

P=15%

 

b)未知病例前后两次诊断结果对照表

病例号

BP神经网络第二次诊断

贝叶斯第二次诊断

诊断结果

与第一次比较

诊断结果

与第一次比较

61

肾炎

肾炎

62

肾炎

肾炎

63

肾炎

肾炎

健康

64

肾炎

肾炎

65

肾炎

肾炎

66

肾炎

肾炎

健康

67

健康

肾炎

肾炎

健康

68

肾炎

肾炎

69

肾炎

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 初中教育 > 科学

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2