传染病预测的数学模型研究.pdf

资源描述

传染病预测的数学模型研究.pdf

《传染病预测的数学模型研究.pdf》由会员分享，可在线阅读，更多相关《传染病预测的数学模型研究.pdf（5页珍藏版）》请在冰点文库上搜索。

传染病预测的数学模型研究.pdf

1994-2010ChinaAcademicJournalElectronicPublishingHouse.Allrightsreserved.http:

/3:

辽宁省教育厅课题（20061020）1.中国医科大学公共卫生学院（110001）2.中国医科大学88期7年制3.中国医科大学89期:

通讯作者jwm传染病预测的数学模型研究3王丙刚1,2曲波1郭海强1张蕾1,2金鑫1,3李刚1,3孙高1目前,对传染病的研究有4种方法:

叙述性研究,分析性研究,实验性研究和理论性研究。

在理论性研究中,数学模型起着极其重要的作用。

它把传染病的主要特征通过假设、参数、变量和它们之间的联系清晰地揭示出来。

数学模型的分析结果能提供许多强有力的理论基础和概念。

用数学模型帮助发现传染病的传播机理预测传染病的流行趋势已成为共识。

通过建立适当的数学模型,对传染病的发生时间,传播方式进行预测,以便政府有关部门可以及时采取有效地措施,减小其危害。

下面,就对现在几种常用的传染病的数学模型进行综述。

微分方程模型微分方程模型是比较简单和基本的封闭体系模型1,此模型假设:

该地区的总人数N恒定,无迁出、迁入和死亡等现象,并假设染病者一经发病既不会痊愈,也不会死亡,保持染病状态,易感者转入染病者的变化率与当时易感者人数及染病者人数之积成正比。

下面就是微分方程的基本模型SI（susceptibleInfec2tive）模型2:

dS（t）/dt=-S（t）I（t）

（1）S（t）+I（t）=N

（2）从中推导,将

（2）式I（t）=N-S（t）代入

（1）式,再用可分离方程解法,其中令B=N,A=I0/N（3）最终得到I（t）=I0eBt/1-A（1-eBt）（4）其中S（t）为t时刻的易受传染者的数目,I（t）为t时刻的传染者数目,I0是开始时传染者数目。

是感染速率常数,A、B均为数学模型（4）的参数。

对公式（4）求一阶导数,化简后推导得:

I（t）=I0BeBt（1-A）/1-A（10eBt）2（5）公式（5）实际上是感染者累计的变化速度,反映了传染病的平均的变化规律,一般称为流行病曲线。

对公式（5）在求一阶导数得二阶导数I（t）,并设二阶导数I（t）=0,求得累计数变化速度最大的时间T:

T=（1/B）Ln（1/A）-1（6）T常称发病高峰时间。

以上是SI模型的一些重要指标的推导,但SI模型也有它的局限性,当t,即I（t）=n,这表明了最后所有的人都被传染了,这显然不符合常理。

因为通常患病者痊愈后会有一定的免疫力,于是Kermack等3在1927年提出了另一个基于SI模型基础上的传染病模型,简称SIR模型,他把整个人口分为3类,易受传染者（Susceptiblehosts）、传染者（Infectedhosts）、病愈后具有免疫力者（Recoveredandimmunehosts）。

得出的排除人数变化率近似等于:

dR/dt=Asech2（t-）,其中,A、都是正常数,可以通过曲线拟合确定。

虽然此模型较SI模型有了很大进步,但是以上两种模型都没有考虑传染病的潜伏期,从患病到治愈的恢复期等。

因此,后来又在kermack模型的3类人中增加一类人,即感染而未发病者（exposedhosts）。

由这4类人的关系可以得到更复杂的传染病微分方程模型:

SEIR（假设病愈后获得终生的免疫力）。

然而,以上模型描述的都是传染病的自然发展过程,没有考虑人的因素,当人被发现患病后,会采取有效的措施进行控制,隔离或者治疗,因此使用该模型时要注意应用条件的限制。

余弦模型余弦模型分析是研究周期现象的简单模型,可用于分析角度、生物节律和时间成周期性的变量,因此,余弦模型常用来研究传染病的季节变化规律。

模型的余弦曲线用中值M,振幅A,峰值位相时和角频率四个参数来表示。

曲线以余弦函数表示为4:

Yi=M+Acos（ti-）（6）ti为自变量,通常是有一定的周期T的时间,通过三角函数变换,可将（6）式演变为:

Yi=M+Xcosti+Ysinti

（2）式中X=Acos,Y=Asin,X,Y为参数。

将（7）式的三角函数改用系数表示:

Yi=M+CiX+SiY（8）式中,Ci=costi,Si=sinti,（8）式中的参数是线性635中国卫生统计2007年10月第24卷第5期1994-2010ChinaAcademicJournalElectronicPublishingHouse.Allrightsreserved.http:

/的,是线性回归方程。

在周期性回归中,虽然常用简单余弦模型,即（6）式,但要对数据更好地拟合,有时需要把两个或多个余弦曲线叠加起来。

其通式为:

yi=M+A1cos（ti-1）+A2cos（2ti-2）+Akcos（ktk-k）（9）式（9）称为三角多项式,A1cos（ti-1）,A2cos（2ti-2）,Akcos（ktk-k）等项称为第1,2,第k谐量。

如果第1谐量没有得到满意的拟合效果,一般资料用到第2谐量即可得到较满意的拟合效果5,仿式（3）,含第2谐量的余弦模型可写成:

yi=M+C1iX1+S1iY1+C2iX2+S2iY2（10）式中Xj=Ajcosj,yj=Aisinj,Cji=cosjti,Sji=sinjti,j=1,2式（9）用最小二乘法,可得方程组:

nM+（C1i）X1+（S1i）Y1+（C2i）X2+（S2i）Y2=yi（C1i）M+（C1i2）X1+（C1iS1i）Y1+（C1iC2i）X2+（C1iS2i）Y2=C1iyi（S1i）M+（C1iS1i）X1+（S1i2）Y1+（C2iS1i）X2+（S1iS2i）Y2=S1iyi（C2i）M+（C1iC2i）X1+（C2iS2i）Y1+（C2iC2）X2+（C2iS2i）Y2=C2iyi（S2i）M+（C1S2i）X1+（S1iS2i）Y1+（C2iS2i）X2+（S2i2）Y2=S2iyi（11）根据A,和X,Y的关系可求得Aj,j。

决定系数R2=（Yi-Yji）2/（Yi-Y）2,它表示用余弦曲线拟合可以解释发病率Yi变异的百分率。

利用以上的余弦模型,可以预测流行病的周期性变化。

杨倬等6人用此种方法对深圳龙岗区甲乙类传染病季节变化规律进行了探讨,证实了该数学模型与实际资料符合度较高,效果良好。

谢学勤等7人将其用于北京市痢疾月平均发病率的对数拟合及发病季节特征进行分析,其对实际资料进行拟合,效果良好。

灰色预测模型灰色系统理论（GreySystemTheory）是邓聚龙教授于20世纪80年代创立的,该理论最早应用于农业和工业问题,近年来,灰色理论开始应用于传染病等的预测和预报8。

灰色系统理论认为:

任何随机过程都可以看作是在一定时空区域变化的灰色过程,随机量可看作是灰色量,无规的离散时空数列是潜在的、有规序列的一种表现,通过生成变换可将无规序列变成可以满足灰色建模条件的有规序列。

所以,灰色系统理论建模实际上是对生成数列的建模,而一般建模方法则是对原始数据建模。

灰色预测是基于微分方程的预测,在实际预测中所采用的多为一阶一元灰色模型预测方法,即GM（1,1）预测,它在灰色理论的基础上,根据系统的已知信息,用灰色模块理论将无规律的原始数据经累加生成为有规律的生成数据,进而建立一阶线性微分动态时间序列模型,利用这一模型对灰色信息进行处理,按一定规律提高灰色模块的白化度,从而达到揭示事物内部的特征与规律的目的。

以独特的数字方法把难以描述的理论作为灰色理论来处理,弱化随机因素的干扰,从杂乱无章的现象中揭示事物的发展规律。

GM（1,1）模型已在各个领域被普遍采用,它的微分方程为:

（1）/dt+aX

（1）=在该模型中,多数称灰色作用量,其大小反映因子作用的强弱,即数据变化的关系:

参数a称发展系数,可反映疾病发展态势,若为负,发展态势是增长,若为正,发展态势是衰减,它的绝对值越大,则增长（或减少）越快。

预测模型的方程为9:

（1）=X（0）

（1）-（/a）e-ak+（/a）,k=0,1,2（12）当a013时,GM（1,1）模型可用于中长期预测。

当013-a015时,GM（1,1）模型可用于短期预测,中长期预测慎用。

当015-a1时,不宜采用GM（1,1）模型,可考虑其他预测方法。

与传统的统计模型相比,该模型在疾病预测方面具有明显优点:

（1）少数据性,少到只需4个数据就可以建立模型进行预测,并且可允许使用被噪声污染了的数据,它通过就数找数,注意用现有数据来挖掘隐含信息。

（2）良好的时效性,它将系统看成一个随时间变化而变化的函数,因而可揭示系统随时间发展变化的规律,并且在模型中可不断地引入最新信息,剔除最老信息。

（3）较强的系统和关联性,它将研究对象作为一个发展变化的系统,可对事物发展态势进行量化比较分析,其动态过程能反映系统已知信息和未知信息互相影响,互相制约的系统特征,并能揭示系统内涵的本质联系。

（4）建模精度较高,可保持原系统的特征,能较好地反映系统的实际情况,根据不同的预测等级和容许误差值,选用不同的模型,既可做长期趋势预报分735ChineseJournalofHealthStatistics,Oct2007,Vol.24,No.51994-2010ChinaAcademicJournalElectronicPublishingHouse.Allrightsreserved.http:

/析,也可做中,短期预测。

但是其缺点是当数据序列的波动幅度较大时,GM（1,1）模型的精度很难提高,只能用于数据离散较小且发展趋势呈单调序列的情况,无法分析系统的波动规律,但是,经残差修正后,得到的残差GM（1,1）模型的精度会有所提高10。

Markov模型Markov模型是近年来应用较多的利用概率建立一种随机时序模型来进行预测的数学模型,其是以俄国数学家A1A1Markov来命名的11。

从20世纪80年代起逐渐用来模拟慢性疾病的发展过程。

Markov模型是一种非参数的离散型时间序列分析方法,是通过对随机过程在不同时刻所处状态之间的变化规律,预测这一过程在下一时刻和下几个时间所处状态的方法。

Markov模型无后效性,就是在已知现在状态的条件下,其将来的状态只与现在有关,而不依赖过去。

它根据疾病的不同阶段和各种状态间的转换概率来模拟疾病进行和结局,相比其他模型能较好地反映疾病的过程,被认为特别适用于慢性疾病研究。

其模型为:

s（k）=s（k-1）P=s（0）pk。

（13）主要的计算步骤是:

收集疫情资料,划分状态（一般可分为36个）,统计各个状态的频数,在除以总频数,从而计算出各状态的初始概率,计算一阶概率随机矩阵,根据要预测的次数,计算2阶至预测次数为阶数的概率随机矩阵。

然后,利用以上各阶概率随机矩阵,分别进行预测。

正是由于Markov模型预测结果取决于一阶转移概率矩阵,而这个矩阵是不会一成不变的,故其近期预测结果较好。

用Markov模型特别适用于有波动性改变的疾病资料,关键是要有足够长的时间序列资料,才能保证处理结果的可靠性,取不同阶段的发病的历史资料建立模型进行预测,对预测值与实际值进行拟合,发现其在短期预测中的准确度很高,而对长期预测效果欠佳,故在进行预测时,要随时根据新的资料对转移概率阵不断进行调整,确保预测结果的合理可靠。

Markov链预测是区间预测,虽然降低了预测的精度,但却提高预测的准确度。

在含有未知因素和随机性的情况下很少有点预测值同将来的实际值完全一致的情况。

因此预测发病率实际值实现的范围,对预防传染病具有现实意义。

近年来国外医学还引进状态空间模型State-SpaceModel）,即描述符合Markov特性的动态完整的模型。

Ghahra-man等12人曾详细介绍过该模型的原理,方法与意义;Penny等13人在此基础上介入Kalman滤波技术。

王倩等14人通过以人群中筛查幽门螺旋杆菌感染,以预测胃癌的方案进行卫生经济学评价为例,研究Markov模型在卫生经济评价的应用,其结论认为能够较好地应用于临床决策分析中。

丁元林等15人通过多应用多状态Markov模型研究2型糖尿病不同发展阶段的影响因素,取得了满意的效果,其结论是多状态Markov模型是探讨慢性病不同发展阶段影响因素的一种有效工具,在慢性病流行病学研究中具有广阔的应用前景。

人工神经网络模型1943年,美国心理学家WarrenMcCulloch和数学家WalterPitts合作提出了形式神经元的数学模型M-P模型,近年来人工神经网络（ANN）在传染病分析与预测中的应用越来越广泛,成为传染病研究的热点模型之一心16。

按模型性质神经网络可分为数学模型和认知模型:

数学模型是对系统特征的数学抽象描述;认知模型是根据神经系统信息处理过程建立的,可以模拟感知,思维,问题求解等过程。

目前已出现数十种神经网络模型中最为典型的数学模型有前馈神经网络,反馈神经网络以及随机神经网络等。

主要的认知模型有Kohonen自组织模型,自适应谐振理论（ART）,遗传神经网络,模糊神经网络等。

人工神经网络的最大优点在于能够调整自身结构去适应样本特性,完全克服了传统参数模型让样本来适应自身的固有缺陷,可以不受任何限制自动学习识别变量间的关系。

该特性适合于探索性研究,其基本思路是从理论上提出病因假设,然后用神经网络进行模拟,如果神经网络可以很好地模拟出这种关系,即可支持病因假设,反之则推翻。

人工神经网络不需要精确的数学模型,没有任何对变量的假设要求,能通过模拟人的智能行为处理一些复杂的,不确定的,非线性的问题,具有很强的容错性和联想记忆功能17。

由于它是大量神经元的集体行为,因而表现出一般复杂非线性动态系统的特性,可以处理环境信息十分复杂,知识背景不清楚,推理规则不明确的问题。

它为处理模糊的,数据不完全的,模拟的,不精确的模式识别提供了一个全新的途径。

多层前馈网络,即误差反向传播网络BP网络（BackpropagationNeuralNetwork）神经网络模型,是人工神经网络中应用最广泛的一种,尤其在流行病学领域应用更为广泛。

其是一种非线性映射人工神经网络,它是以一种有教师示教的方式进行学习,由于BP网及误差逆传播算法具有中间隐含层并有相应的学习规则可寻,使得它具有对非线性模式的识别能力,是非线性可微分函数进行权值训练的多层前馈网络。

特别是其数学意义明确,步骤分明的学习算法,更使其有广835中国卫生统计2007年10月第24卷第5期1994-2010ChinaAcademicJournalElectronicPublishingHouse.Allrightsreserved.http:

/泛的应有前景。

John18等通过神经网络方法验证了艾滋病进展的过程依赖于HLA-I和HLA-II等位基因与TAP变易体的相互作用的假说,神经网络方法为病因分析提供了新的工具。

贝叶斯模型贝叶斯统计是当今两大主要统计学派之一,它与经典统计学派（又称频率学派）在统计推断理论和方法上存在重大差异。

托马斯贝叶斯（ReverendThomasBayes,17021761）的论文“机遇理论中一个问题的解”被公认为贝叶斯统计的奠基之作。

贝叶斯统计是综合未知参数的先验信息与样本信息,依据贝叶斯定理,求出后验分布,根据后验分布推断未知参数的统计方法19。

它与经典统计的主要区别有:

在统计推断中包括先验信息,未知参数可以看作是随机变量,事件的概率一定要有频率解释和概率可用经验来确定。

统计推断所使用的信息可以归纳为三种:

总体信息、样本信息和先验信息。

贝叶斯学派很重视先验信息的收集、挖掘和加工,使它数量化,形成先验分布,参加到统计推断中来,以提高统计推断的质量。

忽视先验信息的利用,有时是一种浪费,有时会导致不合理的结论。

同时,若误用先验信息,或统计结论过多的依赖于先验,也会造成不良后果。

贝叶斯方法的优点在于可以将多种来源的信息、参数的不确定性整合于一个模型中,充分利用先验信息并可以不断用抽样研究的信息对其进行更新从而积累证据指导实践。

贝叶斯法比普通法计算的结果更加稳定,特别是人口规模小时,利用贝叶斯方法,可以减少人口规模小的地区的推测值的离散程度,使指标更加稳定,可以有效地减少随机变异对结果的影响,为制定决策提供更为可靠的数据支持。

但是本方法也有一些缺陷:

第一,发病数为零。

有时会出现某地区发病数为零的情况,这时也可以用贝叶斯方法推测出该地区的标准化发病率。

如果推测所用的省级发病数为零,则无法用贝叶斯方法进行推测。

第二,关于贝叶斯推测的假设:

贝叶斯推测时有一些基本假设,其中对结果影响较大的假设为:

各省省内发病为同质的。

如果有的地区发病与期望值差别很大,则应该对该地区进行单独分析。

第三,关于柏松分布的假设:

有些疾病可能并不符合柏松分布。

Geurden等应用Bayes方法对3个诊断试验下的十二指肠贾第虫感染率进行了估计,Dorny等在考虑专家意见的基础上,获得了4个诊断试验下的猪囊虫病患病率的较好估计,Erkanli等将Bayes估计用于两阶段筛查试验的纵向资料,Tu等提出了一种带协变量的Bayes率估计方法并用于HIV筛查,他们将这种方法与传统的最大似然估计进行了比较,认为该方法不仅纳入了筛查方法灵敏度和特异的有关信息,而且考虑到这些信息的不正确定性,不失为一种正确估计率的重要方法20。

通径分析模型通径分析（pathanalysis）是数量遗传学家SewallWright于1921年提出来,经遗传育种学者不断改进和完善形成的一种多元统计技术,已在众多领域广泛应用。

通径分析是回归分析的补充和发展,通径分析方法的核心思想是,将复杂系统内某一自变量对因变量的总影响有效分解为直接影响和间接影响。

通径分析是标准的线性回归分析,一个性状（自变量）除了可通过直接作用引起目标性状（依变量）变化外,还可通过其相关性状间接引起目标性状的变化,要弄清这些性状的直接效应和间接效应,就是通径分析。

通径分析把相关系数分解为直接作用和间接作用,汇集相关,回归分析的许多结果,可以更清楚、直观地反映各自变量对因变量的影响,以及自变量之间的相互关系,揭示多元线性回归难以表达的变量间的复杂关系21。

通过计算通径系数和剩余通径系数可指出各影响因素以及研究中未被观察和考虑到的因素及其作用的大小。

通径分析是建立在相关分析的基础上,可定量地分析各因素直接和间接对因变量影响的大小及其作用的相对重要性。

通径分析方法不仅能分析已引入的变量,还可分析未包括在研究中、但却有实际影响的因素总作用的大小,由此可提示是否需要进一步寻找其他影响因素。

这是别的多因素分析方法无法比拟的22。

通径分析可以全面地考察变量间的相互作用,包括直接作用和间接作用。

通径分析的另一个优势是可以用通径图直观地显示变量间的结构关系,并可以进行验证和修改直到拟合满意为止。

通径分析亦存在某些不足,如主观性和随意性较大。

通径分析的关键问题是结合专业知识建造通径图（这也是通径分析的难点）,尤其是当变量较多时,何种通径图较优很难确定。

对同一问题,不同的研究者可以得到不同的结果;同一研究者对同一问题也可设计出不同的通径图,而不同通径图会得到不同的分析结果。

小结除了以上的常用数学模型以外,还有很多其它的模型,例如:

logistic回归流行潜势模型,分隔空间数学模型等,但是,所有的数学模型还存在着共同的问题:

935ChineseJournalofHealthStatistics,Oct2007,Vol.24,No.51994-2010ChinaAcademicJournalElectronicPublishingHouse.Allrightsreserved.http:

/11疾病的发生发展受多种因素影响,而每种预测方法都有其应用的条件和优缺点,因此,一种预测方法很难得到预期的效果。

21用数学模型对疾病进行预测,得到的只是个理论值,并不与实际值完全相符,任何一种模型都是对实际情况的抽象,难免有局限性和不完备性。

31建立模型所依赖的资料多是来源于流行病学回顾性调查,不光样本量有限,而且预报变量仅为流行病学指标,没有客观,特意的生物学指标,其在不断地发展演变过程中难免会存在或出现某些不可预知与不可测量的变量,使得原有的拟合模型不再适用或分析预测性能降低。

由于以上原因,对一组（多维）相关随机变量的动态过程同时进行观测,并将其作为整体加以研究,根据自己资料的特点选用适合的方法,并用多种方法进行预测,能寻求到一个基于这些单一模型而又博采众长的模型,或者尝试着将多种方法综合起来进行分析,势必能更系统、更全面地反映动态现象的内部规律性和未来趋势。

这在医学卫生领域中尚处于不太成熟的阶段,有待于进一步地开发研究。

参考文献11ShuginB,StoneL,AgurZ.PulsevaccinationstrategyintheSIRepi2demicmodel.Bul1MathBiol,1998,60:

1226.21FengZ,IannelliM,MilnerFA.Atwo2straintuberculosismodelwithageofinfection.SIAMAPPlMath,2002,62（5）:

163421656.31RileyS,etal.TransmissionDynamicsofetiologicalagentofSARSinHongKong:

impactofpublicheathinterventions.Science,2003,300:

196121966.41Report:

AIDSepidemicupdateDecember.1999,WHO&UNAIDS,1999.51李艳梅,徐爽.应用余弦模型分析流行性腮腺炎发病季节性.中国卫生统计,1999,16

（1）:

41.61杨倬.利用数学模型研究传染病发病季节特征.现代预防医学,2003,30（6）:

7862788.71谢学勤,高京晓,孙贤理.余弦模型在痢疾季节性研究中的应用.中国公共卫生,2000,16（6）:

560.81GuthmannJP,Llanos2CuentasA,PalaciosA,etal.Environmentalfac2torsaSde1erminantsofmalariarisk:

Adescriptivestudyonthenorth2erncoastofPeruTpMedIntHealth,2002,7:

5182525.91龚向龙,王全佩,张君炎,等.试应用灰色系统GM（1,1）模型预测性病发病率.中国公共卫生,1997:

13（11）:

6432644.101ChristopheBoete,JacobCK.Atheoreticalapproachtopredictingthesuccessofgeneticmanipulationofmalariamosquitoesinmalariacon2trol.Mar,2002,1:

3210.111GuoWS,MarshallG.ORDMKV:

acomputerprogramfittingpropor2tionaloddsmodelformulti2stateMarkovprocess.CputerMethodsandProgramsinBiomedicine,1995,46:

2572263.121GhahramniZ.Variationlearningforswitchingstate2spacemodels.Neu2ral2Compute,2000,12（4）:

8312864.131PennyWD,RobertsSJ.Dynamicmodelsfornostationarysignalseg2mentation.Compute2Bicmed2Res,1999,32（6）:

4832502.141王倩,金丕焕.Markov模型在卫生

展开阅读全文