ImageVerifierCode 换一换
格式:DOCX , 页数:139 ,大小:188.02KB ,
资源ID:8922998      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bingdoc.com/d-8922998.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(医学统计学课后习题答案.docx)为本站会员(b****8)主动上传,冰点文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰点文库(发送邮件至service@bingdoc.com或直接QQ联系客服),我们立即给予删除!

医学统计学课后习题答案.docx

1、医学统计学课后习题答案 医学统计学第一章 绪论答案名词解释:(1) 同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基础上各观察单位(或个体)之间的差异。(2) 总体和样本:总体是根据研究目的确定的同质观察单位的全体。样本是从总体中随机抽取的部分观察单位。 (3) 参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为样本统计量。(4) 抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误差。(5) 概率:是描述随机事件发生的可能性大小的数值,用p表示(6) 计量资料:由一群个体的变量值构成的资料称为计量资料。(

2、7) 计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称为计数资料。(8) 等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为等级资料。是非题:1. 2. 3. 4. 5. 6. 7. 单选题:1. C2. E3. D4. C5. D6. B第二章 计量资料统计描述及正态分布答案名词解释:1. 平均数是描述数据分布集中趋势(中心位置)和平均水平的指标2. 标准差 是描述数据分布离散程度(或变量变化的变异程度)的指标3. 标准正态分布 以服从均数为0、标准差为1的正态分布,这种正态分布称为标准状态分布。4. 参考值范围参考值范围也称正常值范围,医学上常把把绝大多数的某指 标范

3、围称为指标的正常值范围。填空题:1. 计量,计数,等级2. 设计,收集资料,分析资料,整理资料。3. (变量变换)标准正态分布、0、14. 68.27% 95% 99%5. 47.5%6.均数、标准差7. 全距、方差、标准差、变异系数8. 9. 全距 R10. 检验水准、显著性水准、0.05、 0.01 (0.1)11. 80% 90% 95% 99% 95%12. 95% 99%13. 集中趋势、离散趋势14. 中位数15. 同质基础,合理分组16. 均数,均数,规律性17. 标准差18. 单位不同,均数相差较大是非题:1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 1

4、2. 13. 14. 15. 16. 17. 18. 19. 20. 21. 单选题:1. B2. D3. C4. A5. C6. D7. E8. A9. C10. D11. B12. C13. C14. C15. A16. C17. E18. C19. D20. C21. B22. B23. E24. C25. A26. C27. B28. D29. D30. D31. A32. E33. D34. A35. D36. D37. C38. E39. D40. B41. C42. B43. D44. C45. B问答题:1均数几何均数和中位数的适用范围有何异同? 答:相同点,均表示计量资料集中

5、趋势的指标。不同点:表2-5. 表2-5 均数,几何均数和中位数的相异点 平 均 数 意 义 应用场合 均 数 平均数量水平 应用甚广,最适用于对称分布,特别是正态分布几何均数 平均增减倍数 等比资料;对数正态分布资料 中位数 位次居中的观 偏态资料;分布不明资料;分布一端或两察值水平 端出现不确定值 2中位数与百分位数在意义上计算和应用上有何区别与联系? 答: 1) 意义:中位数是百分位中的第50分位数,常用于描述偏态分布资料的集中位置,反映位次居中的观察值水平。百分位数是用于描述样本或总体观察值序列在某百分位置的水平,最常用的百分位是P50即中位数。多个百分位数结合使用,可更全面地描述总体

6、或样本的分布特征。 (2)计算:中位数和百分位数均可用同一公式计算,即 Px=L+(i/fx)(nx%-fL) 可根据研究目的选择不同的百分位数代入公式进行计算分析。 (3)应用:中位数常用于描述偏态分布资料的集中趋势;百分位数常用于医学参考值范围的确定。中位数常和其它分位数结合起来描述分布的特征,在实际工作中更为常用。百分位数还可以用来描述变量值的离散趋势(四分位数间距)。3同一资料的标准差是否一定小于均数? 答:不一定。同一资料的标准差的大小与均数无关,主要与本资料的变异度有关。 变异大,标准差就大,有时比均数大;变异小,标准差小。4测得一组资料,如身高或体重等,从统计上讲,影响其标准差大

7、小的因素有哪些? (1)样本含量的大小,样本含量越大,标准差越稳定。 (2)分组的多少 (3)分布形状的影响,偏态分布的标准差较近似正态分布大 (4)随机测量误差大小的影响 (5)研究总体中观察值之间变异程度大小5正态分布标准正态分布与对数正态分布在概念上和应用上有何异同?(1) 概念上:相同点:正态分布、标准正态分布与对数正态分布都是变量的 连续型分布。其特征是:分布曲线在横轴上方,略呈钟型,以均数为中心,两边对称,均数处最高,两边逐渐减小,向外延伸,不与横轴相交。相异点:表示方法不同,正态分布用N(,2)表示,标准正态分布用N(0,1)表示,对数正态分布N(lgX,2lgX)表示。(2)

8、应用上:相同点:正态分布、对数正态分布都可以转换为标准正态分布。相异点:标准正态分布是标准正态变量u的分布,标准正态曲线下的面积唯一的由u决定,给应用带来极大方便。对医学资料呈偏态分布的数据,有的经对数变换后服从正态分布。正态分布、对数正态分布可描述变量值的分布特征,可用于正常值范围估计和质量控制等。正态分布是很多统计方法的理论基础。6医学中参考值范围的含义是什么?确定的原则和方法是什么?含义:参考值范围亦称正常值范围,它是指特定健康状况人群(排除了有关疾病和因素对所研究指标有影响的所谓“正常人”不同于“健康人”概念)的解剖、生理、生化等数据绝大多数人的波动范围。(2)原则: 抽取有代表性的足

9、够例数的正常人群样本,样本分布越接近总体,所得结果越可靠。一般认为样本含量最好在100例以上,以能得到一个分布较为稳定的样本为原则。 对选定的正常人进行准确而统一的测定,保证测定数据可靠是确定正常值范围的前提。 判定是否要分组(如男女、年龄、地区等) 确定正常值范围。 决定取双侧范围值还是单侧范围值。 选择适当的百分范围 确定可疑范围 估计界值 (3)方法: 百分位数法:Px=L+(i/fx)(nx%-fL) 正态分布法(对数正态分布): 百分位数法用于各种分布型(或分布不明)资料;正态分布法用于服从或近似正态分布(服从对数正态分布)的资料。7对称分布资料在“均数1.96倍标准差”的范围内,也

10、包括95%的观察值吗? 答:不一定。均数1.96倍标准差是正态分布的分布规律,对称分布不一定是正态分布。计算题:1. 某地101例3049岁健康男子血清总胆固醇值(mmol/L)测定结果如下: 4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.71 5.69 4.12 4.56 4.37 5.39 6.30 5.21 7.22 5.54 3.93 5.21 6.51 5.18 5.77 4.79 5.12 5.20 5.10 4.70 4074 3.50 4.69 4.38 4.89 6.25 5.32 4.50 4.63 3.61 4.44 4.43 4.25 4.0

11、3 5.85 4.09 3.35 4.08 4.79 5.30 4.97 3.18 3.97 5.16 5.10 5.86 4.79 5.34 4.24 4.32 4.77 6.36 6.38 4.86 5.55 3.04 4.55 3.35 4.87 4.17 5.85 5.16 5.09 4.52 4.38 4.31 4.58 5.72 6.55 4.76 4.61 4.17 4.03 4.47 3.04 3.91 2.70 4.60 4.09 5.96 5.48 4.40 4.55 5.38 3.89 4.60 4.47 3.64 4.34 5.18 6.14 3.24 4.90 3.0

12、5 (1)编制频数分布表,简述其分布特征。 找出最大值、最小值求全距(R): 全距=最大值-最小值=7.22-2.70=4.50(mmol/L) 求组距:I=全距/组数=4.52/10=0.4520.5(mmol/L) 分组段,划记(表1-1) 表2-6 某地101例3049岁健康男子血清总胆固醇值划记表 组段(mmol/L) 划记 频数 2.5 13.0 83.5 94.0 234.5 255.0 175.5 96.0 66.5 27.07.5 1合计 101 由表2-6可知,本例频数分布中间局多,两侧逐渐减少,左右基本对称。 表2-7 某地101例3049岁健康男子血清总胆固醇值(mmol

13、/L)、s计算表 血清总胆 组中值 频数 fX fX2 累计 累计频数 固醇值 X f 频数 (实际) 2.5 2.75 1 2.75 7.563 1 0.0099 3.0 3.25 8 26.00 84.500 9 0.0891 3.5 3.75 9 33.75 126.563 18 0.1782 4.0 4.25 23 97.75 415.438 41 0.4059 4.5 4.75 25 118.75 564.063 66 0.6535 5.0 5.25 17 89.25 468.563 83 0.8218 5.5 5.75 9 51.75 297.563 92 0.9109 6.0 6

14、.25 6 37.50 234.375 98 0.9703 6.5 6.75 2 13.50 91.125 100 0.9901 7.07.5 7.25 1 7.25 52.563 101 1.0000 478.25 2242.315 注:Xu为组段上限值(2)计算均数、标准s、变异系数CV。 由上计算表1-2可见:478.25/101=4.735(mmol/L) =0.882(mmol/L)CV=100%=0.882/4.735100%=18.627%(3)计算中位数M,并与均数X比较,利用前表计算中位数M M = L+(i/f50)(n50%-fL) =4.5+(0.5/25)(10150

15、%-41)=4.69(mmol/L) 本题算术均数为4.735(mmol/L),与中位数4.69(mmol/L)很接近,这也是资料服从正态分布的特征之一。(4)计算P2.5及P97.5并与1.96s的范围比较。 P2。5=3.0+(0.5/8)(1012.5%-1)=3.095(mmol/L)P97.5=6.5+(0.5/2)(10197.5%-98)=6.619(mmol/L) 1.96S=4.7351.960.882=3.016.46(mmol/L) 用百分位数法求得101例3049岁健康男子血清总胆固醇值95%分布范围3.0956.619(mmol/L),与正态分布法求得的95%分布范围

16、3.016.46(mmol/L)基本一致。(5)分别考察1S、1.96S、2.58S范围内的实际频数与理论分布是否基本一致(表1-3) 表2-8 某地101例3049岁健康男子血清总胆固醇值理论分布与实际分布比较 血清总胆固醇 实际分布 理论分布 人数 % % 3.855.62 72 71.29 68.27 3.016.46 97 96.04 95.00 2.467.01 100 99.01 99.00 由上表, 范围内,实际分布与理论分布略有不同,而、范围内,实际分布与理论分布基本一致。 (6)现测得一40岁男子的血清总胆固醇值为6.993(mmol/L),若按95%正常值范围估计,其血清总

17、胆固醇值是否正常?估计该地3049岁健康男子中,还有百分之几的人血清总胆固醇值比他高? 前计算得95%正常值为3.016.46(mmol/L)现测得一40岁男子的血清总胆固醇值为6.993(mmol/L),在95%范围以外,故属于异常 u=(X-)/=(6.993-4.735)/0.882=2.56因(2.56)=(-2.56),查表1得(-2.56)=0.0052估计该地3049健康男子中约有0.52%的人血清总胆固醇值比他高。2某地卫生防疫站,对30名麻疹易感儿童经气溶胶免疫一个月后,测得其得血凝抑 制抗体滴度资料如表2-9第(1)(2)栏。 表2-9 平均滴度计算表 抗体滴度 人数f 滴

18、度倒数X1 lgX1 flgX1 (1) (2) (3) (4) (5)=(2)(4) 1:8 2 8 0.9031 1.8062 1:16 6 16 1.2041 7.2247 1:32 5 32 1.5051 7.5257 1:64 10 64 1.8062 18.0618 1:128 4 128 2.1072 8.4288 1:256 2 256 2.4082 4.8165 1:512 1 512 2.7093 2.7093 合计 30 50.5730(1) 试计算其平均滴度。 由表1-4得,G=lg-1(50.5730/30)=lg-11.6858=48.5 该站30名麻疹易感儿童经气

19、溶胶免疫一个月后,测得血凝抑制抗体平均滴度为1:48.50 表2-10 平均滴度计算表 抗体滴度 人数f 滴度倒数X1 lgX1 flgX1 (1) (2) (3) (4) (5) = (2)(4) 18 2 8 0.9031 1.8062116 6 16 1.2041 7.2247132 5 32 1.5051 7.5257164 10 64 1.8062 18.06181128 4 128 2.1072 8.42881256 2 256 2.4082 4.81651512 1 512 2.7093 2.7093合计 30 50.5730(2) 有人发现本例用抗体滴度稀释倍数和直接用滴度(原

20、书误为倒数)算得对数值的标准差相同,为什么? 表2-11 滴度对数值计算表抗体滴度X2 人数f lgX2 flgX2 18 2 -0.9031 -1.8062116 6 -1.2041 -7.2247132 5 -1.5051 -7.5257164 10 -1.8062 -18.06181128 4 -2.1072 -8.42881256 2 -2.4082 -4.81651512 1 -2.7093 -2.7093合计 30 -50.5730 1)由表1-4中数据计算标准差为:slgx1=lg-10.4444=2.7823 2) 由表1-5中数据计算标准差为:slgx2=lg-10.4444

21、=2.7823直接用抗体滴度的对数lgx2与稀释倍数的对数lgx1计算标准差是相等的,因为由上表可见lgx2=lg1-lgX1=-lgx1,而lgx1与-lgx1的离散程度是相同的,所以用抗体滴度稀释倍数和直接用滴度算得对数值的标准差是相同的。 3 50例链球菌咽峡炎患者的潜伏期如表2-12,说明用均数、中位数或几何均数, 何者的代表性较好?并作计算。 表2-12 50例链球菌咽峡炎患者的潜伏期的中位数计算表 潜伏期(小时) 病例数f 累计频数 12 1 1 24 7 8 36 11 19 48 11 30 60 7 72 5 84 4 96 2 108120 2 合计 50 本例目测频数分布

22、为偏态分布,长尾拖向右侧,故为正偏态,宜用中位数及几 何均数表示其平均水平。 如上表,经计算中位数,几何均数、算术均数分别为: M=54.55(小时),G=54.08(小时),=58.56(小时)显然,算术均数受长潜伏期的影响使其偏大,中位数M与几何均数G接近,故描述链球菌咽峡炎患者潜伏期的集中趋势指标使用中位数M或几何均数G均可。4.某市1974年为了解该地居民发汞的基础水平,为汞污染的环境监测积累资料,调查 了留住该市一年以上,无明显肝、肾疾病,无汞作业接触史的居民238人,发汞含量 如表2-13: 表2-13 238人发汞含量频数计算表 发汞值 人数f 组中值X fX fX 累计频数 累

23、计频率 (mol/kg) 1.5 20 2.5 50.0 125.00 20 8.40 3.5 66 4.5 297.0 1336.50 86 36.10 5.5 60 6.5 390.0 2535.00 146 61.34 7.5 48 8.5 408.0 3468.00 194 81.50 9.5 18 10.5 189.0 1984.50 212 89.08 11.5 16 12.5 200.0 2500.00 228 95.80 13.5 6 14.5 87.0 1261.50 234 98.32 15.5 1 16.5 16.5 272.25 235 98.74 17.5 0 18.

24、5 0.0 0.00 235 98.74 19.521.5 3 20.5 61.5 1260.75 238 100.00 合计 238 1699.0 14743.50 (1)说明此频数分布的特征:可见发汞值的频数分布高峰位于第2个组段。前4个组段的频数占总频数的81.5%,长尾拖向右侧,呈极度正偏态。 (2). 计算均数 和中位数M,何者较大?为什么?何者用语说明本资料的集中位置较合适? =1699/238=7.139(mol/kg) M =L+(i/f50)(n50%-fL) =5.5+2/60(23850%-86)=6.6(mol/kg) 由计算结果得知,其原因因为本例呈正态分布,均数计算

25、结果受到少 数较大发汞值的影响,使得偏向大发汞值一边.本例用中位数描述偏态资 料的集中趋势较好,它不受两端较大值和极小值的影响.(3). 选用何种指标描述其离散程度较好? 选用四分位数间距描述其离散程度较好.(4). 估计该地居民发汞值的95%参考值范围 本资料应选用单侧95%上界值,本例是正偏态分布.而且样本含量较大, n=238,保证获得一个较为稳定的分布,故采用百分位数法计算的参考值范 围较为合适. P95=L+(i/f95)(n95%-fL) =11.5+(2/16)(23895%-212)=13.2625(mol/kg)第三章 均数的抽样误差与t检验答案填空题:1. 标准误2. 0.

26、05,0.013. 假设检验,(显著性检验)4. 两总体均数不同(越有理由说明有统计学意义)5. 自由度大小6. 一是准确度、二是精度7. 抽样误差、样本均数、总体均数8. 总体均数估计、假设检验9. 第二类错误(型错误) 是非题:1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 单选题:1. A2. E3. D4. E5. E6. E7. D8. A9. D10. D11. D12. B13. E14. D15. D16. E17. B18. C19. C20. D21. C 问答题:

27、1标准差和标准误有何区别和联系? 表3-6 标准差与标准误的区别 标准差(或s) 标准误() 意义上 描述一组变量值之间的离散趋势 描述样本均数间的离散趋势 应用上 s越小,表示变量值围绕 越小,表示样本均数与均值分布越密集,说明均数 总体均数越接近,说明样本 的代表性越好。 均数推断总体均数可靠性越大。 可用估计变量值分 可用估计总体 布范围 均数可信区间 与n的关系 n越大,s越趋于稳定 n越大,越小 (2)联系 二者均是表示变异度大小的统计指标。 标准误与标准差大小成正比,与抽样例数n的平方根成反比。 当n一定时,同一份资料,标准差越大,标准误也越大。 2可信区间和参考值范围有何不同?

28、参考值范围是指同质总体中个体变量值的分布范围,如X1.96s说明有95%的变量值分布在此范围内,它与标准差的大小有关,若个体变异越大,该范围越宽,分布也就越散。而可信区间是指在可信度为(1-)时,估计总体参数可能存在的范围。即从同一总体中随机抽样,当n一定时,每抽一次即可得一个样本均值,以计算可信区间,如95%可信区间,类似的随机抽样进行一百次,平均有95次,即有95个可信区间包括了总体均数,有5次没有包括括总体均数,5%是小概率事件,实际发生的可能性很小,因此实际应用中就认为总体均数在求得的可信区间。这种估计方法犯错误的可能性最大不超过5%。可信区间与标准误大小有关,标准误越大,可信区间则越大。3假设检验和区间估计有何联系?假设检验和区间估计都属于统计推断的内容。假设检验用以推断总体参数间是否有质的区别,并可获得样本统计量,以得到相对精确的概率值。而可信区间用于推断总体参数的大小,它不仅可用以回答假设检验的问题,尚可比假设检验提供更多的信息。但这并不意味着用可信区间代替假设检验,因为假设检验可得到P值,比较精确地说明结论的概率保证,而可信区间只能告诉我们在某水准上有无统计意义,却不能像P那样提供精确的概率。因此,只有将二者有机地结合起来,相互补充,才是完整的分析。

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2