数学建模论文.docx
《数学建模论文.docx》由会员分享,可在线阅读,更多相关《数学建模论文.docx(35页珍藏版)》请在冰点文库上搜索。
数学建模论文
华北科技学院
课程设计说明书
班级:
计算B112
姓名:
宋富洪学号:
201109014207成绩:
______
设计题目:
艾滋病疗法的评价及疗效的预测
设计时间:
2013.7.8至2013.7.12
指导教师:
谭立云
评语:
_______________________________________________
_______________________________________________
_______________________________________________
_______________________________________________
评阅教师:
_______________
艾滋病疗法的评价及疗效的预测
摘要:
通过对附件1、附件2的大量数据分析观察,可以发现其数据符合均匀分布,所以采用其数学期望来代替整体数据的特征。
问题一,根据艾滋病病人初始时刻体内的CD4细胞浓度分为三个类:
严重、中等和轻度病人。
然后研究各组人群在治疗各个阶段的CD4细胞浓度的期望,用最小二乘法拟合出患者体内CD4在服药的40周内的曲线,然后,通过此方程做出70周内的CD4细胞浓度,求出最佳治疗终止时间。
对于问题二,由于病人的测试时间为第0周、第4周、第8周,、第24周、第40周,计算出每一个病人的CD4细胞浓度在时间段[0,4]、[4,8][8,16][16,24]、[24,32]的变化量,再求出所有病人体内CD4细胞浓度的平均变化量。
对于问题三也是类似的处理方法。
结论1:
一般而言,病人同时服用三种药物在半年内有效。
因此治疗时间超过半年,病情会出现反复,从而最佳治疗终止时间为第20周左右。
结论2:
若仅以CD4浓度为判断指标,则第四个方案的治疗效果为最佳。
且最佳治疗终止时间为第10周左右。
结论3:
当病人还需要考虑治疗的费用时,最佳治疗方案是方案1,最佳治疗终止时间是56天左右。
关键词:
最小二乘法;拟合;CD4细胞浓度;平均变化量
一、问题重述
艾滋病的医学全名为“获得性免疫缺损综合症”,英文简称AIDS,它是由艾滋病毒(简称HIV)引起的,是当前人类社会最严重的疾病之一。
HIV病毒破坏人的免疫系统,使人体丧失抵抗各种疾病的能力,从而严重危害人的生命。
人类免疫系统的CD4细胞在抵御HIV的入侵中起着重要作用。
当CD4被HIV感染而裂解时,其数量会急剧减少,HIV。
将迅速增加,导致AIDS发作。
艾滋病治疗的目的,是尽量减少人体内HIV的数量,同时产生更多的CD4。
故由CD4或HIV的剂量数可以获知或预测艾滋病的治疗情况。
附件1和附件2给出了美国艾滋病医疗试验机构ACTG公布的两组数据。
ACTG320(见附件1)是同时服用zidovudine(齐多夫定),lamivudine(拉美夫定)和indinavir
(茚地那韦)3种药物的300多名病人每隔几周测试的CD4和HIV的浓度(每毫升血液里的数量)。
193A(见附件2)是将1300多名病人随机地分为4组,每组按下述4种疗法中的一种服药,大约每隔8周测试的CD4浓度(这组数据缺HIV浓度,它的测试成本很高)。
主要研究下列问题:
(1)利用附件1的数据,预测继续治疗的效果,或者确定最佳治疗终止时间。
(2)利用附件2的数据,仅以CD4为标准评价4种疗法的优劣,并对较优的疗法预测继续治疗的效果,或者确定最佳治疗终止时间。
(3)给出不发达国家艾滋病主要药瓶价格,考虑4种疗法的费用,判断
(2)中的评价和预测(或者提前终止)的改变。
二、模型假设
1、大量数据符合平均分布的统计规律,用其数学期望来代替在某一点的值,并且能反映
2、根据样本数据特点,我们规定4周为一个月,一个月为28天计算。
3、继续治疗指在测试终止后继续服药,终止治疗指测试后终止服药。
4、样本数据的测试时相互独立的,即每一位病人在任何一个时刻的测试数据不受其他病人的影响,也不受其本身其他时刻数据的影响。
三、模型的建立与求解
问题一
1.问题分析
在艾滋病治疗过程中,目的是尽量减少人体内HIV的数量,同时产生更多的CD4细胞,至少要有效的降低CD4细胞减少的速度,以提高人体的免疫能力。
因此,根据CD4细胞核HIV病毒的浓度的变化,可以预测治疗的效果。
但是在考虑到收集的数据的随机性,如随个体身体状况、免疫能力的差异,我们通过统计手段,对数据进行处理,然后得到需要的浓度。
2.数据的处理与绘图
通过对附件1数据的观察与分析,可以做出CD4细胞浓度随时间周变化的散点图:
图1CD4细胞浓度分布的散点图
从图1中可以看出CD4细胞浓度符合平均分布的规律,所以可以用它的平均值来代替其数学期望,来表示整体数据的特征。
由于同一时间测量的浓度跨度比较大,所以需要对数据进行进一步的处理,可以将数据通过其固有的特征进行分类,是数据的数学期望更具有代表性。
根据国外最新研究显示,抗病毒治疗前的CD4细胞计数可能是影响免疫功能重建程度的重要因素之一,初始CD4细胞含量反映了个人的个体差异(如身体状况、免疫能力等)。
因此,将问题一中病人按初始时刻体内的CD4细胞浓度含量分为3类:
0~99×0.2/μl、100~199×0.2/μl、≥200×0.2/μl,分别对应艾滋病病情的严重、中等、轻度。
对附件1中的数据分类之后,对每个类别的数据进行了统计分析处理,可知测试阶段大概分为0、4、8、24、42周等的时间间隔,对所对应的所有数据进行了分析处理(除去误差比较打的数据),因为数据符合平均分布的特点,用其数学期望来代表这些数据的整体特征,如下表:
表1三类病人的CD4和HIV浓度的数学期望0.2/μl
病人
0周
4周
8周
24周
42周
第一类
CD4
<100
39.8683
85.9783
105.147
134.1034
118.277
HIV
<100
5.1613
3.3921
3.1231
2.9815
3.9429
第二类
CD4
100~199
145.491
201.987
223.69
223.884
144.333
HIV
100~199
4.8144
2.9750
2.6597
2.5968
2.7250
第三类
CD4
≥200
234.737
266.666
278.779
292.889
317.083
HIV
≥200
4.8263
2.7333
2.6333
2.3316
1.7000
通过最小二乘法的数据拟合,发现了CD4随时间呈抛物线分布。
因为拟合得到的二次曲线与在0~42周时间内的数据点能比较准确地符合,因此,此曲线能较好的表现这42周内的发展趋势。
以下表是这三类的二次曲线拟合:
表2CD4的拟合曲线方程
浓度范围/(0.2/μl)
拟合方程
0~99
100~199
≥200
Y=51.198+6.7964X-0.12509X2
Y=161.29+7.8893X-0.19935X2
Y=246.03+3.2327X-0.03808X2
各个方程的拟合曲线如下:
图2初浓度<100(0.2/μl)的CD4拟合曲线
图3初浓度为100~199(0.2/μl)的CD4拟合曲线
图4初浓度为≥200(0.2/μl)的CD4拟合曲线
由图2~图4知道,所拟合的CD4曲线,在0~42周内实际值与与曲线拟合相当的好。
因为CD4与HIV之间有相互抑制的作用,由图1的散点图可知CD4与HIV之间近似为指数的分布,以下是这三类的拟合方程:
表3CD4与HIV数量关系的拟合方程
浓度范围(0.2/μl)
方程
0~99
100~199
≥200
Y=380.2e-0.39x
Y=302.9e-0.15x
Y=363.3e-0.1x
由于CD4的细胞数量与HIV的数量有很明显的指数关系,所以这里只考虑CD4浓度的变化即可。
用表1提供的三个方程做出0~70范围内的曲线如下:
图5三类的预测图
由图中的曲线走势可知患者应该在服药后的40周左右停止吃药,所以最佳治疗终止时间为40左右。
问题二
问题分析:
利用附件2的数据来评价4种艾滋病疗法的优劣(仅以CD4为标准),并对较优的疗法预测继续治疗的效果,或者确定最佳治疗终止时间。
这四种疗法如下:
1=600mgzidovudine与400mgdidanosine按月轮换使用;
2=600mgzidovudine加2.25mgzalcitabine;
3=600mgzidovudine加400mgdidanosine;
4=600mgzidovudine加400mgdidanosine加400mgnevirapine。
由于附件2中的数据,每个病人的测试时间并不是相同的,所以取一些有代表性的数据进行分析处理。
以下表是代表部分数据:
表4附件2部分数据
ID
疗法
年龄
时间
Log(CD4+1)
1
2
36.4271
0
3.1355
1
2
36.4271
7.5714
3.0445
1
2
36.4271
15.5714
2.7726
1
2
36.4271
23.5714
2.8332
1
2
36.4271
32.5714
3.2189
1
2
36.4271
40
3.0445
30
3
42.1821
0
2.1972
30
3
42.1821
8.1429
2.3979
30
3
42.1821
16.1429
2.4849
30
3
42.1821
23.8571
1.9459
30
3
42.1821
35.1429
1.9459
30
3
42.1821
37.7143
1.9459
31
4
34.6338
0
3.0445
31
4
34.6338
6.8571
3.6109
31
4
34.6338
15.8571
3.4340
31
4
34.6338
23.8571
2.8904
31
4
34.6338
31.8571
3.1781
31
4
34.6338
39.8571
2.3026
56
1
40.3313
0
1.7047
56
1
40.3313
8.1429
1.7918
56
1
40.3313
16.1429
0.6931
56
1
40.3313
25.4286
1.0986
56
1
40.3313
33.4286
0.6931
56
1
40.3313
39.1429
0.6931
在此问题中,每位病人观测的时间间隔是8周,有的观测了一个8周,有的观测了二个8周,有的观测了三个8周,有的观测了四个8周。
并且每个8周治疗的效果是不一样的,如可能第一个8周治疗效果比较明显,而第二个或第三个8周的治疗也不一定那么明显。
并且每个病人的初始病情也各不相同,即是他血液中所含的CD4细胞浓度或HIV细胞浓度初始值是不同的,所以主要由用CD4细胞浓度的变化量来表示。
根据附件2中的数据,可以获得每一个病人每一个8周的CD4细胞浓度变化量的数据,为了获得方案的总体效果,求出每一个方案下的每一个8周病人CD4浓度平均变化量,如下表:
表5各个方案不同周期的CD4细胞浓度平均变化量
治疗方案
第一个8周
第二个8周
第三个8周
第四个8周
第五个8周
1
-0.11473
-0.12262
-0.17101
-0.2047
-0.22279
2
-0.00157
-0.14781
-0.13619
-0.15499
-0.15763
3
0.17693
-0.09526
-0.13704
-0.31271
0.043714
4
0.38452
0.074904
-0.10536
-0.1796
-0.13109
从表中可以看出第一个8周第4个方案的CD4浓度平均变化量呈增加性,且是最大的,而第一个方案CD4细胞浓度呈下降,第二个8周只有方案四CD4细胞浓度是增加的。
可以对每个8周的变化量分为4个等级为:
最好、好、一般、差。
把表5的各个数据分类结果如下:
表6各个方案在不同时间间隔的治疗效果
治疗方案
第一个8周
第二个8周
第三个8周
第四个8周
第五个8周
1
差
一般
差
一般
差
2
一般
差
好
最好
一般
3
好
好
一般
差
最好
4
最好
最好
最好
好
好
从表6中可以很明显的看出方案四治疗效果总体是最好的。
进一步可以算出每一种方案的CD4细胞浓度的变化速度,即是平均变化量如下表:
表7每种方案下的每8周的细胞浓度平均变化量
治疗方案
每8周的CD4细胞浓度平均变化量
方差
1
-0.16717
0.002313
2
-0.11964
0.004425
3
-0.06487
0.034454
4
0.008675
0.053408
从表7可以了解到无论从CD4细胞浓度的平均变化量来看,还是以方差来看方案四的数值都是最大的。
所以方案四的治疗效果是4个方案中最好的。
另外,为了获得更加精准的最佳治疗时间,还可以做出方案四的CD4细胞浓度的平均变化量与时间t之间的拟合方程。
图6方案4的细胞浓度的平均变化量与时间t的关系
从图6可以看出拟合效果还是很好的,拟合方程为:
Y=0.00091772t2-0.045439t+0.38329
表8ModelSummaryandParameterEstimates
DependentVariable:
VAR00001
Equation
ModelSummary
ParameterEstimates
RSquare
F
df1
df2
Sig.
Constant
b1
b2
Quadratic
1.000
7.831E3
2
2
.000
.383
-.045
.001
TheindependentvariableisVAR00002.
由表8可知R2=1,可知该回归方程通过了回归检验。
可以用来做预测。
所以当CD4细胞浓度的平均变化量Y=0时,解得方程t=10.784。
结论:
对于最佳方案4来说,其最佳治疗终止时间为第10周左右。
另外附件2中还出现了病人的年龄,但通过SPSS软件分析了CD4细胞浓度的平均变化量与病人年龄无相关关系,所以没有必要考虑年龄的因素。
问题三
问题分析:
因为4种疗法是每隔8周测试一次,又4种疗法均为日用药量,所以算出测试周期的单位费用,即每8周的用药费用,也称为一个疗程,如下表的具体疗法和计算结果:
表9每个方案每8周的费用
方案疗法
用药处方
一个疗程费用(美元)
1
前4周用药:
600mgzidovudine;后4周用药:
400mgdidanosine
68.6
2
600mgzidovudine加2.25mgzalcitabine
193.2
3
600mgzidovudine加400mgdidanosine
137.2
4
600mgzidovudine加400mgdidanosine加400mgnevirapine
204.4
由此可以计算出每一种方案的各个不同测试周期的CD4细胞浓度的单位成本。
大家都知道,当考虑到成本是,病人希望以最低的费用获得最好的疗效,可以把它理解为CD4变化量的单位成本最低。
所以,再计算每一种的绝对变化的单位平均成本,如下表:
表10每个方案的CD4细胞浓度变化的单位成本
方案
第一个8周
第二个8周
第三个8周
第四个8周
第五个8周
CD4绝对变化量平均单位成本
1
-0.30605
-0.38252
-0.30663
-0.52518
-0.16563
0.3372
2
-0.00144
-0.16984
-0.086705
-0.12595
-0.048952
0.08658
3
0.2231
-0.15552
-0.12285
-0.37607
0.01593
0.17869
4
0.35743
0.083552
0.083552
-0.15992
-0.04040
0.14125
由表9可以看出,去CD4细胞浓度绝对变化量平均单位成本最低的为最优方案,所以选方案2为最优方案。
图7方案2的CD4浓度平均变化量与时间因素t的关系
由上图可知曲线的拟合程度较好。
图7的拟合方程为:
Y=-0.011274t3+0.12778t2-0.42908t+0.30238
然后再令Y=0,解上述方程得t=0.9519。
结论:
对于方案2来说,最佳治疗终止时间为56天左右。
四、模型的评价与改进
优点:
(1)对于给出的大量杂乱无章的数据,都是首先剔除部分不全的数据,比如附件2中有的病人就只测出了初始时刻的CD4细胞和HIV细胞的含量,还有有些周数不齐的数据也要剔除。
然后再分别对其进行处理,对于问题一,问题二的预测是非常精确的。
(2)对于四种疗法的评价,采用了计算CD4细胞浓度的平均变化量并通过拟合来预测疗法的疗效,这样能够有效避免受到CD4细胞浓度初始值的影响。
这个方法也是很好的。
不足:
(1)对于问题一来说,预测不是那么的精确,所以可用其他更有效的方法来预测。
(2)将数据统一来观察,这方法是简单易行的,但需要处理大量数据,工作量是非常的大,而且比较繁琐。
改进:
模型可以考虑采用人工智能或数据挖掘的方法,更快速第剔除无用的数据,找到数据的内在规律和有意义的数据。
五、参考文献
[1]马莉.MTALAB数学实验与建模.北京:
清华大学出版社,2010
[2]朱建平.应用多元统计(第二版).北京:
科学出版社,2012
[3]阮晓青.周义仓.数学建模引论.北京:
高等教育出版社,2005
附录
问题一的部分代码:
plot(A(:
1),A(:
2),'ko');------A第1列为时间,第2列为CD4
fori=1:
length(A)------A为附件1中第1列病人编号,2列时间,3列CD4,3列为HIV
ifA(i,2)==0&&A(i,3)<100
j=i;
whileA(j,1)==A(j+1,1)
A(j,1)=1;
j=j+1;
end
A(j,1)=1;
end
ifA(i,2)==0&&A(i,3)>=100&&A(i,3)<=199
j=i;
whileA(j,1)==A(j+1,1)
A(j,1)=2;
j=j+1;
end
A(j,1)=2;
end
ifA(i,2)==0&&A(i,3)>=200
j=i;
whileA(j,1)==A(j+1,1)
A(j,1)=3;
j=j+1;
end
A(j,1)=3;
end
end
%--------------¼ÆËãCD4Ũ¶ÈÆÚÍû-----------------
sum=zeros(1,5);
num=zeros(1,5);
fori=1:
length(A)
ifA(i,1)==1&&A(i,2)==0
num
(1)=num
(1)+1;
sum
(1)=A(i,3)+sum
(1);
end
ifA(i,1)==1&&A(i,2)==4
num
(2)=num
(2)+1;
sum
(2)=A(i,3)+sum
(2);
end
ifA(i,1)==1&&A(i,2)==8
num(3)=num(3)+1;
sum(3)=A(i,3)+sum(3);
end
ifA(i,1)==1&&22<=A(i,2)&&A(i,2)<=26
num(4)=num(4)+1;
sum(4)=A(i,3)+sum(4);
end
ifA(i,1)==1&&41<=A(i,2)&&A(i,2)~=99
num(5)=num(5)+1;
sum(5)=A(i,3)+sum(5);
end
end
fori=1:
5
Ave(i)=sum(i)/num(i);
end
sum=zeros(1,5);
num=zeros(1,5);
fori=1:
length(A)
ifA(i,1)==2&&A(i,2)==0
num
(1)=num
(1)+1;
sum
(1)=A(i,3)+sum
(1);
end
ifA(i,1)==2&&A(i,2)==4
num
(2)=num
(2)+1;
sum
(2)=A(i,3)+sum
(2);
end
ifA(i,1)==2&&A(i,2)==8
num(3)=num(3)+1;
sum(3)=A(i,3)+sum(3);
end
ifA(i,1)==2&&25<=A(i,2)&&A(i,2)<=26
num(4)=num(4)+1;
sum(4)=A(i,3)+sum(4);
end
ifA(i,1)==2&&47<=A(i,2)
num(5)=num(5)+1;
sum(5)=A(i,3)+sum(5);
end
end
fori=1:
5
Ave(i)=sum(i)/num(i);
end
sum=zeros(1,5);
num=zeros(1,5);
fori=1:
length(A)
ifA(i,1)==3&&A(i,2)==0
num
(1)=num
(1)+1;
sum
(1)=A(i,3)+sum
(1);
end
ifA(i,1)==3&&A(i,2)==4
num
(2)=num
(2)+1;
sum
(2)=A(i,3)+sum
(2);
end
ifA(i,1)==3&&A(i,2)==8
num(3)=num(3)+1;
sum(3)=A(i,3)+sum(3);
end
ifA(i,1)==3&&23<=A(i,2)&&A(i,2)<=26
num(4)=num(4)+1;
sum(4)=A(i,3)+sum(4);
end
ifA(i,1)==3&&37<=A(i,2)&&A(i,2)~=99
num(5)=num(5)+1;
sum(5)=A(i,3)+sum(5);
end