数学建模竞赛-艾滋病疗法评价及疗效预测模型资料下载.pdf
《数学建模竞赛-艾滋病疗法评价及疗效预测模型资料下载.pdf》由会员分享,可在线阅读,更多相关《数学建模竞赛-艾滋病疗法评价及疗效预测模型资料下载.pdf(23页珍藏版)》请在冰点文库上搜索。
1、利用附件1的数据,预测继续治疗的效果,或者确定最佳治疗终止时间。
2、利用附件2的数据,评价4种疗法的优劣(仅以CD4为标准),并对较优的疗法预测继续治疗的效果,或者确定最佳治疗终止时间。
3、已知艾滋病药品的主要供给商对不发达国家提供的药品价格,如果病人需要考虑4种疗法的费用,对2中的评价和预测(或者提前终止)有什么改变。
二、基本假设1、题中所给出的数据真实,能反映现实情况;
2、最佳治疗终止时间是指:
CD4的浓度(个/l)达到某值的初始时间;
3、治疗有效果是指:
HIV的数量降低,同时产生更多的CD4细胞,至少能有效地降低CD4减少的速度;
4、问题2中疗法的优劣评价,仅以CD4为标准;
5、在疗法1中,以日用量600mgzidovudine或400mgdidanosine按每月交替服用,1个月按30天计算,且在第1月中,每日服用600mgzidovudine;
6、在测试过程中,忽略病人年龄的变化;
7、处于同一年龄段的病人,生理状况一致。
三、问题1的分析、建模与求解1、问题的分析通过分析统计数据,做散点图,拟合出疗效与时间的曲线,就能解决此问题,预测继续治疗的效果,或者确定最佳治疗终止时间。
2、建立数学模型31)对个别测试的CD4(和HIV)的时刻调整由于有个别测试CD4(和HIV)的开始时刻并不是第0周,故将其开始时刻调整为第0周。
即:
设某个体第一次测试的时刻为0t,若00t,则将其各次测试时刻均减去0t。
2)调整CD4的值为相对第0周测试时的比值我们认为服用药物后的CD4值的改变可以反映出疗效的好坏,由于所给出的CD4浓度值差异很大(最小值为0,最大值为9330.2/l个),故对其处理如下:
规定第0周CD4的调整值(4(0)CD)为1,第i周的调整值(4()CDi)为相应原始值(4iCD)与第0周原始值(04CD)的比值,即044()4iCDCDiCD。
3)统计统计第i周调整值4()CDi总和sumCD4(i)和测试人数numCD4(i),用三项移动平均法的思想,令4
(1)4()4
(1)4()4
(1)4()4
(1)sumCDisumCDisumCDimeanCDinumCDinumCDinumCDi用4()meanCDi的值代替4()sumCDi。
统计第i周HIV的测得值总和sumHIV(i)与测试人数numHIV(i),用三项移动平均法的思想,令
(1)()
(1)()
(1)()
(1)sumHIVisumHIVisumHIVimeanHIVinumHIVinumHIVinumHIVi用()meanHIVi的值代替()sumHIVi。
4)作图、拟合由于numCD4(i)=20时对应meanCD4(i)的散点图,根据图形做3次多项式拟合。
用MATLAB中的polyfit函数得到:
拟合多项式系数:
0.00030.02010.44140.7203a拟合曲线:
320.00030.02010.44140.7203yxxx相关系数的平方:
rsquare=0.9839残差平方和:
S=0.1540由此认为拟合比较好散点图、拟合曲线及置信区间如下图:
4图1:
CD4比值的曲线拟合图同样由于numHIV(i)=20时对应meanHIV(i)的散点图,根据散点图确定用负指数函数来拟合。
拟合曲线方程213kxykekgg用Matlab求得:
k1=3.4668,k2=0.4673,k3=2.83650.46733.46682.8365xye残差平方和:
S=0.0966由残差平方和与拟合曲线图看出拟合结果比较好图2:
HIV的曲线拟合图53、预测治疗效果由图1可知在0到45周治疗效果比较好,并能推测出继续治疗10周左右疗效也应比较好,但拟合曲线模型不能预测更长时间治疗效果。
由图2可知,治疗10周后HIV数量趋于稳定值k3;
若某艾滋病患者测试开始时CD4数量为0Q(*0.2/l)第i周后CD4数量为:
32i0Q0.2(0.00030.02010.44140.7203)Qiii(/l)我们认为在HIV降低到稳定值k3的前提下,CD4浓度(个/l)上升到某值(根据文献2,CD4数量达到=350/l,就可以停药观察)的时间为最佳终止时间,因此解方程()iQi,求出i就得到最佳终止时间,即在第i周终止治疗。
4、模型评价及改进该模型建立思路比较简单,曲线拟合效果较好,在对数据处理中用了三项移动平均法,可以剔除数据中的偶然因素;
该模型不能够预测较长时间的疗效;
可以考虑通过某函数,将CD4浓度的改变量与HIV值结合在一起,进行综合考虑。
四、问题2的分析、建模与求解回归模型1、疗法评价1)对附件2的数据处理为了反映某种疗法的疗效,我们将附件2所给出的CD4值(为log(countCD4+1))进行处理。
规定第0周CD4变化值(04CD)为0,第i周的变化值(4iCD)为相应测得值(4iCD)与第0周测得值的差值,即0444iiCDCDCD。
2)评价4种疗法的优劣及较优疗法预测的多元回归模型令10jx采用第j种疗法否则,j=1,2,3,45x表示治疗时间(单位:
周),6x表示年龄(单位:
岁),y表示相应的疗效(即:
4iCD),建立多元回归方程:
2201122334455667586yxxxxxxxx通过求出1234,中的最大值,则对应的疗法最优。
3)疗法评价结果利用MATLAB函数regress(程序见附录)求得:
60.138240.0659900.129860.315160.002410.001410.000360.00001统计量F=46.02571(8,5027)1.94F(=0.05),知回归模型成立。
比较(1,2,3,4)ixi前系数i得,4321,由此可知对于所有年龄段的人,第4种疗法最优,第3种疗法次之,第1种疗法最差。
2、预测疗效用多元回归模型对最优疗法4进行预测,则方程为22055667586yxxxx(56,xx含义与以上一致)将采用疗法4病人的数据代入上述方程,用MATLAB函数regress求得:
1.16280.03050.05730.00090.0007且的置信区间都不包括0,知方程中y(疗效)与治疗时间及年龄的一次项、二次项都有线性关系。
统计量F=10.84651(4,1292)2.37F,知回归模型成立。
将病人的治疗时间及年龄代入上述多元回归方程,就可预测其采用疗法4的治疗效果。
3、模型评价及改进该回归模型能够对疗法优劣做出评价及疗效预测,但相关系数较低,可以通过对每一个点的残差置信区间的分析来剔除一些异常点,以此提高其回归的显著性。
灰色模型1、基于灰色关联度的方法评价4种疗法的优劣1)考虑年龄与不同疗法疗效的关系和各个年龄段统计量的多少,将年龄分段为:
12345age=2525age=3535age=4545age=5555age表1:
年龄段的划分2)数据处理为了反映疗效,规定第0周CD4的测得值(04CD)为0,第i周的变化量(4iCD)为相应测得值(4iCD)与第0周测得值的差值,即0444iiCDCDCD。
已知1300多名病人大约每隔8周测试的CD4浓度,为了数据处理方便,将第8(i-1)(i=1,2,3,4,5,6)周附近进行测试治疗的数据都归入第8(i-1)周。
3)对某一个具体的年龄段,选定母系列和比较序列7定义评价值矩阵64H,其中的元素ijh(i=1,2,3,4,5,6;
j=1,2,3,4)表示该年龄段的采用第j种疗法病人在第8(i-1)周的8
(1)4iCD的平均值。
令014maxiijjhh,则母序列0ih(i=1,2,6)是构造出来的最理想评判值序列。
由1234,iiiihhhh分别构成4个子序列(比较序列)。
4)计算关联度子序列中每个数值与母序列中相应数值的关联系数为:
()()jjabviib,其中0()|jijiihh,1416minmin()jjiai,1416maxmax()jjibi,=0.5。
把关联系数取均值得到关联度:
611(),(1,2,3,4),6jjiuvij关联度表示疗法评判值序列和理想评判值序列相关联的程度,数值越大,表明疗法越好(对于该年龄段的人来说)。
5)模型的求解利用MATLAB编程计算得到各个年龄段的各关联度:
1234age=250.55770.66970.59570.958325age=350.50330.51470.60130.998835age=450.47450.58270.87000.850545age=550.57750.59370.62640.998055age0.64290.47630.84810.90360age0.45710.50090.65820.9978表2:
各年龄段的不同疗法(子序列)对最理想评判序列的关联度(注:
最后一行表示不分年龄段时的关联度)6)疗法评价结论由表2可以看出,不论是分年龄段还是不分年龄段疗法4都是最优的;
除age=1)用MATLAB编程解得:
a=0.0475u=0.3309第i周的变化量4iCD的平均值(4iCD)图形如下:
图3:
CD4变化量的均值与时间的关系图9由图形可以看出,虽然变化量均值4iCD是不断减小,但始终大于0,即测得值CD4的数量没有减少,说明疗法4能有效控制病情的恶化,病人应该继续服药治疗。
3、模型评价及改进灰色关联度模型能较好地分年龄段评价4种疗法的优劣;
灰色预测模型中生成数序列表达式固定(指数形式),用此预测疗效有一定局限性;
为了简化模型,我们进行了年龄分段,但不同的分段形式可能会对疗法的评价产生一定影响,如何来更合理地进行年龄分段这也是模型需要改进的地方。
神经网络模型用输入矢量和相应的输出矢量训练一个网络可以逼近一函数,因此可采用BP神经网络来预测疗法4的治疗效果。
患者的年龄、测试CD4时间、首次测试CD4值作为输入,所给CD4数据作为神经网络输出,隐层数目为50,选择神经单元的传递函数分别为tansig函数和purelin函数,设置BP网络反传函数为traingdx。
经过训练后网络就可以预测疗法4的疗效。
(MATLAB程序见附录)五、问题3的分析、建模与求解本问题需要考虑4种疗法费用,我们可借鉴问题2中评价疗法的灰色关联度的模型,只要对该模型做一些适当的改动就可进行评价。
1、模型建立1)采用第j种疗法的病人每次测试CD4浓度时(第i周),已花费的药费7ijjmoneyiprice其中jprice为第j种疗法的日用药费用:
1price=1.60或0.85,2price=3.45,3price=2.45,4price=3.652)数据处理对附件2中给出的CD4值进行还原作比值处理,由于所给出的CD4的值(4iCD)为log(countCD4+1),我们令4exp(4)1iiCDCD,再规定每个人第0周的CD4的值04CD为1,后第i周的值0444iiCDCDCD为了数据处理方便,将第8i(i=0,1,2,3,4,5)周附近进行测试CD4浓度的数据都归入第8i周。
3)重新定义评价值矩阵64H修改元素ijh(i=1,2,3,4,5,6;
j=1,2,3,4)10考虑到每种疗法的治疗效果不同,所用药费不同,以及患者的贫富程度不同,因此引入效益函数(4,)ffCDmoney,表示患者的贫富程度。
修改H矩阵,元素ijh为采用第j种疗法患者的效益函数ijf的平均值,即ijijhf。
效益函数为8
(1),8
(1),41ijijijCDfmoney(0,i=1,2,3,6;
j=1,2,3,4)越大,表示患者越富有,效益函数越大;
时,4fCD,表示患者十分富有,只需考虑疗法的治疗效果;
4)模型结论利用MATLAB编程可计算得到取不同值时各个年龄段的各关联度:
1时各个年龄段的各关联度1234age=250.64880.60190.64060.968825age=351.00000.62070.74980.732235age=450.93070.64740.86290.686445age=550.80650.55590.84590.682355age0.96320.63820.75990.68850age0.98040.61940.82840.7158由上表知,1时,总体来说疗法1的疗效最好;
在年龄段45age=55时,疗法3的疗效最好;
在年龄段age=25时,疗法4的疗效最好100000时各个年龄段的各关联度1234age=250.62550.65670.64150.985025age=350.57760.57080.67790.996335age=450.56670.59420.87450.802145age=550.65230.68880.89720.899255age0.64660.50910.80810.85010age0.51820.54190.77250.9337由上表知,100000时,总体来说疗效4最好;
在年龄段35age=45,疗效3最好。
疗法关联度年龄疗法关联度年龄11比较取不同值的这两种情况可知,越大患者会采用疗效与好的疗法(费用也高),低患者会采用费用低的疗法(疗效也较差)。
由于病人的贫富程度不一,对于较贫穷的患者采用较优的疗法4,治疗一段时间后一定会因为经济原因提前终止治疗,终止治疗后病情会恶化。
2、模型评价该模型评价疗法的优劣很不错,也是存在年龄分段是否合理,缺少理论依据的缺点。
参考文献:
1型组织相容性复合物的CD4与艾滋病(HIV)的关系.http:
/年9月16日2恩威健康网.抗逆转录病毒治疗的时机和用药方案
(2).http:
/年9月16日。
3萧树铁、姜启源等.数学实验.北京:
高等教育出版社,19994刘晓石、陈鸿建等.概率论与数理统计.北京:
科学出版社,20055白凤山、么焕民等.数学建模(上册).哈尔滨:
哈尔滨工业大学出版社,20036张震、张超、张昊.水质的评价和预测模型.工程数学学报.第22卷.第7期:
37页38页,20057周开利、康耀红.神经网络模型及其MATLAB仿真程序设计.北京:
清华大学出版社,200512附录MATLAB程序1、CD4拟合程序clc;
loaddata;
%data中存有附件1的数据矩阵Alen=length(A);
B=A;
id=23423;
n=1;
d=0;
whilenlenifB(n,1)=id;
B(n,2)=B(n,2)-d;
elsed=B(n,2);
ifd=0B(n,2)=B(n,2)-d;
elsed=0;
endid=B(n,1);
endn=n+1;
endn=1;
whilen0B(n,3)=B(n,3)/cd4;
id=B(n,1);
endendn=n+1;
endnumCD4=zeros(1,58);
sumCD4=zeros(1,58);
13forn=1:
len;
m=B(n,2)+1;
numCD4(m)=numCD4(m)+1;
sumCD4(m)=sumCD4(m)+B(n,3);
endmean1CD4=sumCD4./numCD4mean3CD4=zeros(1,56);
mean3CD4
(1)=(sumCD4
(1)+sumCD4
(2)/(numCD4
(1)+numCD4
(2);
forn=2:
57;
mean3CD4(n)=(sumCD4(n-1)+sumCD4(n)+sumCD4(n+1)/(numCD4(n-1)+numCD4(n)+numCD4(n+1);
endmCD4=1;
len1=1;
mean4CD4=0;
forn=1:
ifnumCD4(n)=20;
mCD4(len1)=n;
mean4CD4(len1)=mean3CD4(n);
len1=length(mCD4)+1;
endendmean4CD4;
mCD4;
a,s=polyfit(mCD4,mean4CD4,3);
Y,delta=polyconf(a,mCD4,s);
figure
(2)plot(mCD4,mean4CD4,*)holdonxlabel(时间(周));
ylabel(CD4比值);
y1=mean(mean4CD4);
rsquare=sum(Y-y1).2)./sum(mean4CD4-y1).2)s=sqrt(sum(mean4CD4-Y).2)./12)x=1:
46;
f=polyval(a,x);
plot(x,f,r)polytool(mCD4,mean4CD4,3)2、HIV拟合程序clc;
14loaddata;
whilen0&
A(n,5)0numHIV(m)=numHIV(m)+1;
sumHIV(m)=sumHIV(m)+A(n,5);
endendmeanHIV1=sumHIV./numHIV;
mean3HIV=zeros(1,46);
mean3HIV
(1)=(sumHIV
(1)+sumHIV
(2)/(numHIV
(1)+numHIV
(2);
mean3HIV(n)=(sumHIV(n-1)+sumHIV(n)+sumHIV(n+1)/(numHIV(n-1)+numHIV(n)+numHIV(n+1);
endmHIV=1;
mean2HIV=0;
46ifnumHIV(n)10;
mHIV(len1)=n;
15mean2HIV(len1)=mean3HIV(n);
len1=length(mHIV)+1;
endendmean2HIV;
mHIV;
plot(mHIV,mean2HIV,*);
holdonk,resnorm,residual,exitflag,output,lambda=lsqcurvefit(fun,1,1,1,mHIV,mean2HIV)x=1:
50;
y=k
(1)*exp(-k
(2)*x)+k(3);
plot(x,y);
xlabel(时间(周));
ylabel(HIV数量);
另:
fun.mfunctiony=fun(k,x)y=k
(1)*exp(-k
(2)*x)+k(3);
3、回归模型疗法判别程序clc;
clear;
loaddata2;
%data2中存有附件2的数据矩阵Alen=length(A);
id=0;
whilen=len;
ifB(n,1)=id;
B(n,5)=B(n,5)-cd4;
elsecd4=B(n,5);
endX=zeros(10,9);
ii=1;
lenm=B(n,2);
16age=B(n,3);
X(ii,1)=1;
X(ii,m+1)=1;
X(ii,6)=B(n,4);
X(ii,8)=B(n,4)2;
X(ii,7)=age;
X(ii,9)=age2;
Y(ii)=B(n,5);
ii=ii+1;
endb,bint,r,rint,s=regress(Y,X);
4、回归模型疗法4预测程序clear;
endii=1;
Y=1;
X=zeros(10,5);
lenage=B(n,3);
ifB(n,2)=4%ifage25X(ii,1)=1;
X(ii,2)=B(n,4);
X(ii,3)=age;
X(ii,4)=B(n,4)2;
X(ii,5)=age2;
17ii=ii+1;
%endendendb,bint,r,rint,s=regress(Y,X)5、灰色关联度评价疗法程序clc;
loadd