ImageVerifierCode 换一换
格式:DOCX , 页数:28 ,大小:87.43KB ,
资源ID:7991077      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bingdoc.com/d-7991077.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(疾病研究问题模拟3.docx)为本站会员(b****6)主动上传,冰点文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰点文库(发送邮件至service@bingdoc.com或直接QQ联系客服),我们立即给予删除!

疾病研究问题模拟3.docx

1、疾病研究问题模拟3疾病研究问题槐妮妮 数学系董小江 物理系张小平 物理系摘要近几十年,人们生出一个健康孩子越来越困难,到底有哪些因素影响胎儿健康?本题给出了两组数据,病例组和对照组,为了判断胎儿某种疾病的诱发因素,我们应用统计学知识建立相应模型。对于两组数据可用判别分析法得到判别函数,我们用判别函数与回归函数的等同性,得出回归函数,再根据回归平方和,描述了全体自变量对总体的影响,一步一步用剔除法,最终可得出影响胎儿健康的诱发因素,利用MATLAB软件编程可以大大简化我们对数据的处理。最后我们得到该疾病的诱发因素为:鼻炎家族史、孕期用药、先兆早产、流产史、剖宫产、孕期营养、出生体重、妊娠反应等八

2、种诱发因素。关键字:MATLAB程、判别分析法、剔除法、F检验、一、 问题重述世界卫生组织最近发布的资料显示,与50年前相比,人们的生殖能力明显降低了,生一个活泼健康的孩子,越来越像一个复杂的系统工程,需要精心运作每一个细节,不敢稍有松懈麻痹,到底是什么原因威胁胎儿的健康也是医学上一个非常复杂的问题。本题就胎儿的某种疾病影响因素做了详细的调查与记录(见附件1),根据附件1中的数据,我们要利用统计学知识判断到底该疾病的诱发因素有哪些。二、 问题分析本题对胎儿的某种疾病影响因素做了详细的调查与记录,我们要利用统计学知识判断到底该疾病的诱发因素有哪些。题中给出了病例组和对照组两组数据,我们可以利用统

3、计学知识判别分析法先找出两组数据的判别函数,判别函数的系数也就是我们所求回归函数的系数,得出回归方程,我们可用剔除法。回归平方和描述了全体变量对总体的影响,用回归平方和算出去掉第i个数的检验统计量F的值,对照F检验,可一次剔除一个影响因素,判别它的影响度是否显著,如果显著则保留它,如果不显著则剔除掉。依次剔除每一个因素,然后计算其它因素的回归平方和,得出这个因素的影响度,再判断它的显著度。依次进行便可得出对于该疾病的诱发因素。三、 模型假设与符号说明1、 对于这二百个人的选取具有随机性,代表性。2、 影响该疾病的诱发因素已在给出的因素之中,不会再有其他未发现因素。3、 所给出的数据具有准确性。

4、不存在其它人为因素。符号说明(i=1、2、311、12):第个影响因素的值;(i=1、2、311、12):第个影响因素的系数;:回归方程的响应变量;:判别函数的系数SSR:回归平方和SSR(i):去掉第i个数后的回归平方和Ui:偏回归平方和Fi:去掉第i个数的检验统计量F的值P:疾病影响因素的个数A:由病例组数据所构成的矩阵B:由对照组数据所构成的矩阵四、 模型建立与求解步骤一、建立多元线性回归模型首先利用题中已知条件建立自变量为该胎儿疾病致病因素,因变量为胎儿患病可能性的回归方程为:因为回归方程的系数与最优判别函数的系数是一致的(或相差一个常数倍数)从而最优判别函数与回归方程(出常系数外)在

5、形式上是一样的。利用FISHER判别法求出判别是否患病的判别函数,附表一、二给出了病例组和对照组的各个因素情况,可将其分为A组和B组,将其数据对应成两个矩阵。 (1)、求每列的平均值 (2)做两个矩阵的离差矩阵(3)把A、B矩阵化成正矩阵(4)求系数矩阵我们用MATLAB对判别分析法求解判别式所编的程序1(程序1见附录),可直接求解出我们所需的判别式的系数矩阵C,两组数据的判别值Ya,Yb以及临界值Y0,还有对函数的检验值F,通过与F检验表中的值比较,可以知道我们的模型是否有效,数据是否可用。 解出的C为(0.0051,0.0009,0.0002,0.0052,0.0116,0.0025,0.

6、0033,0.0051,0.0047, -0.0004,-0.0035,0.0016) 判别式为:即回归方程为步骤二、利用剔除法依次对每一个因素进行剔除我们知道,回归平方和SSR描述了全体自变量对总体的影响。为了研究某个xi(i=1、2、11、12)的作用,先把xi从P个因素中剔除出去,只考虑P-1个因素,做这P-1个因素的回归平方和SSR(i)。并记Ui=SSR-SSR(i),并称其为在P-1个因素中x(i)的偏回归平方和。去掉第i个数的检验统计量F的值为: 算出Fi的值,显著性水平的值取=0.05,查出若,则保留xi,说明因素xi的影响是显著的。若,则剔除xi1,说明因素xi的影响是不显著

7、的。这样从回归方程中去掉了xi,变成了P-1元的线性回归方程。当剔除一个变量后,再考虑剩余变量对回归函数的影响,就这样,依次剔除其他不显著的因素。对于数据比较庞大,我们借助MATLAB软件编程(附录程序二),可以直接算出每一次的回归平方和,偏回归平方和及F值。第一个因素的剔除当去掉一个因素时,每一个因素所对应的回归平方和与F值如下表:因素X1X2X3X4X5X6SSR0.01320.01510.01510.01290.00940.0146F27.37520.4669-0.483932.6729112.00295.8686因素X7X8X9X10X11X12SSR0.01490.01300.013

8、40.01510.01450.0146F2.251430.735024.4593-0.42287.15066.0148查表可得F0.05(1,187)=3.84,对照上表中数据,在每一个因素所对应的F值中找出小于3.84的F值,并找出其中最小的,即X3,将其剔除出去。第二个因素的剔除每一个因素所对应的回归平方和与F值如下表:因素X1X2X4X5X6SSR0.01320.01510.01280.00940.0146F27.59080.545334.2125112.67526.3288因素X7X8X9X10X11X12SSR0.01490.01300.01340.01510.01450.0146F

9、2.265730.838424.49300.35767.20636.0573对照上表中数据,在每一个因素所对应的F值中找出小于3.84的F值,并找出其中最小的,即X10,将其剔除出去。第三个因素的剔除每一个因素所对应的回归平方和与F值如下表:因素X1X2X4X5X6SSR0.01310.01500.01270.00900.0146F28.47980.636534.5393127.75346.8551因素X7X8X9X11X12SSR0.01490.01300.01330.01450.0146F2.706430.966124.96297.65976.3718对照上表中数据,在每一个因素所对应的F

10、值中找出小于3.84的F值,并找出其中最小的,即X2,将其剔除出去。第四个因素的剔除每一个因素所对应的回归平方和与F值如下表:因素X1X4X5X6X7SSR0.01370.01270.00890.01450.0148F29.008534.8743131.87087.83873.5022因素X8X9X11X12SSR0.01290.01330.01440.0145F32.714725.40387.07377.2381对照上表中数据,在每一个因素所对应的F值中找出小于3.84的F值,并找出其中最小的,即X7,将其剔除出去。第四个因素的剔除每一个因素所对应的回归平方和与F值如下表:因素X1X4X5X

11、6SSR0.01290.01250.00840.0143F27.857634.8707141.26336.6019因素X8X9X11X12SSR0.01270.01370.01410.0143F31.337824.89339.25746.6475对照上表中数据,每一个因素所对应的F值都大于3.84,故其对回归方程的影响都是显著的。故我们用上边的模型可剔除掉的因素有孕期活动量、主(被)动吸烟、孕早期病毒感染、早产。即鼻炎家族史、孕期用药、先兆早产、流产史、早产、剖宫产、孕期活动量、出生体重、妊娠反应为该疾病的诱发因素。五、 模型检验可将我们得出的诱发因素与在两组数据中的所求的每个因素所占总体的百

12、分比所对比出来的诱发因素相比较,基本符实。各因素所占总体百分比如下表:影响因素鼻炎家族史主(被)动吸烟 孕早期病毒感染孕期用药先兆早产流产史病例组45%54%40%59%36%38%对照组24%54%32%37%3%30%影响因素早产剖宫产孕期营养孕期活动量出生体重 (kg)妊娠反应病例组9%63%59%69%对照组3%33530%87%六、 模型评价与推广1、优点我们对于讨论某种疾病的主次因素所建立的模型容易理解算法简单,而且剔除法使模型简化,保留了关键因素,减少了判断疾病影响因素程序。在MATLAB中所编程序使处理数据的过程大大简化,降低了我们工作的难度.2、缺点 由于后两个因素与前边几个

13、因素的数据不具有统一性,因此,对于后两个因素的判别就有了一定的误差。3、模型推广对于我们的这个模型对于其他病历也可以适用,只需要改变它的影响因素个数及其每个因素所对应的量值就可以了。七、 模型改进由检验可知,对于后两个因素的判别有一定的误差,分析可知由于后两个因素与前几个因素数据类型不太统一,如果可将后两组的数据做相应的变动转化成前几组数据类型,比如,可将“出生体重”的三个等级划分开,转化成三个因素,每一的因素所对应的事件发生则为“有=1”,不发生则为“无=0”。 “妊娠反应”同“出生体重”一样做相应转化,这样可使我们的结果更准确。八、 参考文献1、 阮晓青 周义仓 数学建模引论 北京 高等教

14、育出版社 20102、 盛骤 谢式千 潘承毅 概率论与数理统计北京 高等教育出版社 20103、 2012九、 附录表一病例组患儿代码鼻炎家族史主(被)动吸烟 孕早期病毒感染孕期用药先兆早产流产史早产剖宫产孕期营养孕期活动量出生体重 (kg)妊娠反应无=0 有=1无=0 有=1无=0 有=1无=0 有=1无=0 有=1无=0 有=1无=0 有=1无=0 有=1一般0 好1小0 一般12.5=1 2.54=2 4=3轻1 中2 重311111010101212000001011122301100001012140111000001215010011011121611010101102370100

15、010001238010110111022901000000012110000110001021111000100110211200111101102213110001000131141001100110231510010000112116111010011022170111000001221800010000012119011100001133200000110001212101011001112122100000010121230000000101232410011101112125011110010022260011010101232710010000112128101100011122

16、290001101010213010111001102131011001011123321111010110213311010011112134110100111121350000100110133610110100012137010000010121380100100111213911110000002340000000111121411001100001324211010101002343111111010121440110100110234510110000102146000101110012471011110100314810111001112149000001000023500101

17、010111215110010001012252001101101023531110100101215411010001002255000100011121560000100011215700010001012258110110011121591100000000216000110101013161001111011123620010010111216301001010002164010010011121650001000101226611011000102267110001011121681101000111236901101100112170010100001121710110100111

18、217201010000112373110001001121740111000011217511001001002176001101010122770100000011217811001111102179101100010122800100110010218111100001102282000100000121830100100111238411000101112185001101000021860101110111238711110001112188111100000121890100010111219010100101002191100100010121920000100011239300

19、1101001123941111100001219511110000012196010000010123971010000110219810010101112199000001011133100001101001121表二对照组儿童代码鼻炎家族史主(被)动吸烟 孕早期病毒感染孕期用药先兆早产流产史早产剖宫产孕期营养孕期活动量出生体重 (kg)妊娠反应无=0 有=1无=0 有=1无=0 有=1无=0 有=1无=0 有=1无=0 有=1无=0 有=1无=0 有=1一般0 好1小0 一般12.5=1 2.54=2 4=3轻1 中2 重310100000101212001100001121300111010002341000010011325101100010121601000100013170000000011218110100000121901000001012110011001000121111010000101211201000000012213011001010021140111000001211500000000112116010100000122171001010110311810010000012219000000011121201000

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2