医学统计学复习题.docx
《医学统计学复习题.docx》由会员分享,可在线阅读,更多相关《医学统计学复习题.docx(59页珍藏版)》请在冰点文库上搜索。
第一章医学统计中的基本概念
一、单向选择题
1.医学统计学研究的对象是E
A.医学中的小概率事件B.各种类型的数据
C.动物和人的本质D.疾病的预防与治疗
E.有变异的医学事件
2.用样本推论总体,具有代表性的样本指的是E
A.总体中最容易获得的部分个体B.在总体中随意抽取任意个体
C.挑选总体中的有代表性的部分个体D.用配对方法抽取的部分个体
E.依照随机原则抽取总体中的部分个体
3.下列观测结果属于等级资料的是D
A.收缩压测量值B.脉搏数
C.住院天数D.病情程度
E.四种血型
4.随机误差指的是E
A.测量不准引起的误差B.由操作失误引起的误差
C.选择样本不当引起的误差D.选择总体不当引起的误差
E.由偶然因素引起的误差
5.收集资料不可避免的误差是A
A.随机误差B.系统误差
C.过失误差D.记录误差
E.仪器故障误差
二、简答题
1.常见的三类误差是什么?
应采取什么措施和方法加以控制?
常见的三类误差是:
(1)系统误差:
在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。
要尽量查明其原因,必须克服。
(2)随机测量误差:
在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。
譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。
对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。
一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的。
(3)抽样误差:
即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。
这种差异是由抽样引起的,故这种误差叫做抽样误差,要用统计方法进行正确分析。
2.抽样中要求每一个样本应该具有哪三性?
从总体中抽取样本,其样本应具有“代表性”、“随机性”和“可靠性”。
(1)代表性:
就是要求样本中的每一个个体必须符合总体的规定。
(2)随机性:
就是要保证总体中的每个个体均有相同的几率被抽作样本。
(3)可靠性:
即实验的结果要具有可重复性,即由科研课题的样本得出的结果所推测总体的结论有较大的可信度。
由于个体之间存在差异,只有观察一定数量的个体方能体现出其客观规律性。
每个样本的含量越多,可靠性会越大,但是例数增加,人力、物力都会发生困难,所以应以“足够”为准。
需要作“样本例数估计”。
3.什么是两个样本之间的可比性?
可比性是指处理组(临床设计中称为治疗组)与对照组之间,除处理因素不同外,其他可能影响实验结果的因素要求基本齐同,也称为齐同对比原则。
第二章集中趋势的统计描述
一、单项选择题
1.某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是A
A.中位数B.几何均数
C.均数D.百分位数
E.频数分布
2.算术均数与中位数相比,其特点是B
A.不易受极端值的影响B.能充分利用数据的信息
C.抽样误差较大D.更适用于偏态分布资料
E.更适用于分布不明确资料
3.一组原始数据呈正偏态分布,其数据的特点是D
A.数值离散度较小B.数值离散度较大
C.数值分布偏向较大一侧D.数值分布偏向较小一侧
E.数值分布不均匀
4.将一组计量资料整理成频数表的主要目的是E
A.化为计数资料B.便于计算
C.形象描述数据的特点D.为了能够更精确地检验
E.提供数据和描述数据的分布特征
5.6人接种流感疫苗一个月后测定抗体滴度为1:
20、1:
40、1:
80、1:
80、1:
160、1:
320,求平均滴度应选用的指标是B
A.均数B.几何均数
C.中位数D.百分位数
E.倒数的均数
二、计算与分析
1.现测得10名乳腺癌患者化疗后血液尿素氮的含量(mmol/L)分别为3.43,2.96,4.43,3.03,4.53,5.25,5.64,3.82,4.28,5.25,试计算其均数和中位数。
2.某地100例30-40岁健康男子血清总胆固醇值(mg/dl)测定结果如下:
202165199234200213155168189170188168184147219174130183178174
228156171199185195230232191210195165178172124150211177184149
159149160142210142185146223176241164197174172189174173205224
221184177161192181175178172136222113161131170138248153165182
234161169221147209207164147210182183206209201149174253252156
(1)编制频数分布表并画出直方图;
(2)根据频数表计算均值和中位数,并说明用哪一个指标比较合适;
(3)计算百分位数、、和。
(1)编制频数表:
某地100例30-40岁健康男子血清总胆固醇值的频数表
甘油三脂(mg/dL)
(1)
频数
(2)
累积频数
(3)
累积频率
(4)
110~
2
2
2
125~
4
6
6
140~
11
17
17
155~
16
33
33
170~
27
60
60
185~
12
72
72
200~
13
85
85
215~
7
92
92
230~
5
97
97
245~
3
100
100
合计
100
—
—
画直方图:
图某地100例30-40岁健康男子血清总胆固醇值的频数分布
(2)计算均数和中位数:
从上述直方图能够看出:
此计量指标近似服从正态分布,选用均数较为合适。
(3)计算百分位数:
3.测得10名肝癌病人与16名正常人的血清乙型肝炎表面抗原(HBsAg)滴度如下表,试分别计算它们的平均滴度。
肝癌病人与正常人的血清乙肝表面抗原(HBsAg)滴度
滴度倒数
正常人数
肝癌病人数
8
7
1
16
5
2
32
1
3
64
3
2
128
0
1
256
0
1
肝癌病人与正常人的血清乙肝表面抗原(HBsAg)滴度测定结果
滴度倒数(X)
正常人数()
肝癌病人数()
lgx
lgx
lgx
8
7
1
0.90
6.30
0.90
16
5
2
1.20
6.00
2.40
32
1
3
1.50
1.50
4.50
64
3
2
1.81
5.43
3.62
128
0
1
2.11
0.00
2.11
256
0
1
2.41
0.00
2.41
合计
16
10
-
19.23
15.94
正常人乙肝表面抗原(HBsAg)滴度为1:
15.92
肝癌病人乙肝表面抗原(HBsAg)滴度为1:
39.26
第三章离散程度的统计描述
一、单项选择题
1.变异系数主要用于A
A.比较不同计量指标的变异程度B.衡量正态分布的变异程度
C.衡量测量的准确度 D.衡量偏态分布的变异程度
E.衡量样本抽样误差的大小
2.对于近似正态分布的资料,描述其变异程度应选用的指标是E
A.变异系数B.离均差平方和
C.极差D.四分位数间距
E.标准差
3.某项指标95%医学参考值范围表示的是D
A.检测指标在此范围,判断“异常”正确的概率大于或等于95%
B.检测指标在此范围,判断“正常”正确的概率大于或等于95%
C.在“异常”总体中有95%的人在此范围之外
D.在“正常”总体中有95%的人在此范围
E.检测指标若超出此范围,则有95%的把握说明诊断对象为“异常”
4.应用百分位数法估计参考值范围的条件是B
A.数据服从正态分布B.数据服从偏态分布
C.有大样本数据D.数据服从对称分布
E.数据变异不能太大
5.已知动脉硬化患者载脂蛋白B的含量(mg/dl)呈明显偏态分布,描述其个体差异的统计指标应使用E
A.全距B.标准差
C.变异系数D.方差
E.四分位数间距
二、计算与分析
1.下表为10例垂体催乳素微腺瘤的病人手术前后的血催乳素浓度,试说明用何种指标比较手术前后数据的变异情况较为合适。
表手术前后患者血催乳素浓度(ng/ml)
例号
血催乳素浓度
术前
术后
1
276
41
2
880
110
3
1600
280
4
324
61
5
398
105
6
266
43
7
500
25
8
1760
300
9
500
215
10
220
92
血催乳素浓度术前均值=672.4ng/ml,术后均值=127.2ng/ml。
手术前后两组均值相差较大,故选择变异系数作为比较手术前后数据变异情况比较合适。
术前:
,
术后:
,
可以看出:
以标准差作为比较两组变异情况的指标,易夸大手术前血催乳素浓度的变异。
2.某地144例30~45岁正常成年男子的血清总胆固醇测量值近似服从均数为4.95mmol/L,标准差为0.85mmol/L的正态分布。
①试估计该地30~45岁成年男子血清总胆固醇的95%参考值范围;②血清总胆固醇大于5.72mmol/L的正常成年男子约占其总体的百分之多少?
①正常成年男子的血清总胆固醇测量值近似服从正态分布,故可按正态分布法处理。
又因血清总胆固醇测量值过高或过低均属异常,所以应计算双侧参考值范围。
下限:
(mol/L)
上限:
(mmol/L)
即该地区成年男子血清总胆固醇测量值的95%参考值范围为3.28mmol/L~6.62mmol/L。
②该地正常成年男子的血清总胆固醇测量值近似服从均数为4.95mmol/L,标准差为0.85mmol/L的正态分布,计算5.72mmol/L对应的标准正态分布值:
问题转化为求值大于0.91的概率。
由于标准正态分布具有对称性,所以值大于0.91的概率与值小于-0.91的概率相同。
查附表1得,,所以说血清总胆固醇大于5.72mmol/L的正常成年男子约占其总体的18.14%。
3.某地200例正常成人血铅含量的频数分布如下表。
(1)简述该资料的分布特征。
(2)若资料近似呈对数正态分布,试分别用百分位数法和正态分布法估计该地正常成人血铅值的95%参考值范围。
表某地200例正常成人血铅含量(μmol/L)的频数分布
血铅含量
频数
累积频数
0.00~
7
7
0.24~
49
56
0.48~
45
101
0.72~
32
133
0.96~
28
161
1.20~
13
174
1.44~
14
188
1.68~
4
192
1.92~
4
196
2.16~
1
197
2.40~
2
199
2.64~
1
200
(1)从表可以看出,血铅含量较低组段的频数明显高于较高组段,分布不对称。
同正态分布相比,其分布高峰向血铅含量较低方向偏移,长尾向血铅含量较高组段延伸,数据为正偏态分布。
某地200例正常成人血铅含量(μmol/L)的频数分布
血铅含量
组中值
频数
累积频数
累积频率
0.00~
0.12
7
7
3.5
0.24~
0.36
49
56
28.0
0.48~
0.60
45
101
50.5
0.72~
0.84
32
133
66.5
0.96~
1.08
28
161
80.5
1.20~
1.32
13
174
87.0
1.44~
1.56
14
188
94.0
1.68~
1.80
4
192
96.0
1.92~
2.04
4
196
98.0
2.16~
2.28
1
197
98.5
2.40~
2.52
2
199
99.5
2.64~
2.76
1
200
100
(2)因为正常人血铅含量越低越好,所以应计算单侧95%参考值范围。
百分位数法:
第95%百分位数位于1.68~组段,组距为0.24,频数为4,该组段以前的累积频数为188,故
即该地正常成人血铅值的95%参考值范围为小于1.80。
正态分布法:
将组中值进行log变换,根据题中表格,得到均值和标准差计算表。
某地200例正常成人血铅含量()均值和标准差计算表
血铅含量
组中值
()
频数()
0.00~
0.12
-0.92
7
-6.44
5.9248
0.24~
0.36
-0.44
49
-21.56
9.4864
0.48~
0.60
-0.22
45
-9.9
2.178
0.72~
0.84
-0.08
32
-2.56
0.2048
0.96~
1.08
0.03
28
0.84
0.0252
1.20~
1.32
0.12
13
1.56
0.1872
1.44~
1.56
0.19
14
2.66
0.5054
1.68~
1.80
0.26
4
1.04
0.2704
1.92~
2.04
0.31
4
1.24
0.3844
2.16~
2.28
0.36
1
0.36
0.1296
2.40~
2.52
0.40
2
0.80
0.3200
2.64~
2.76
0.44
1
0.44
0.1936
合计
—
—
200
-31.52
19.8098
计算均值和标准差:
单侧95%参考值范围:
即该地正常成人血铅值的95%参考值范围为小于1.96,与百分位数法相比两者相差不大。
第四章抽样误差与假设检验
一、单项选择题
1.样本均数的标准误越小说明E
A.观察个体的变异越小B.观察个体的变异越大
C.抽样误差越大D.由样本均数估计总体均数的可靠性越小
E.由样本均数估计总体均数的可靠性越大
2.抽样误差产生的原因是D
A.样本不是随机抽取B.测量不准确
C.资料不是正态分布D.个体差异
E.统计指标选择不当
3.对于正偏态分布的的总体,当样本含量足够大时,样本均数的分布近似为C
A.正偏态分布B.负偏态分布
C.正态分布D.t分布
E.标准正态分布
4.假设检验的目的是D
A.检验参数估计的准确度B.检验样本统计量是否不同
C.检验样本统计量与总体参数是否不同D.检验总体参数是否不同
E.检验样本的P值是否为小概率
5.根据样本资料算得健康成人白细胞计数的95%可信区间为7.2×109/L~9.1×109/L,其含义是E
A.估计总体中有95%的观察值在此范围内
B.总体均数在该区间的概率为95%
C.样本中有95%的观察值在此范围内
D.该区间包含样本均数的可能性为95%
E.该区间包含总体均数的可能性为95%
二、计算与分析
1.为了解某地区小学生血红蛋白含量的平均水平,现随机抽取该地小学生450人,算得其血红蛋白平均数为101.4g/L,标准差为1.5g/L,试计算该地小学生血红蛋白平均数的95%可信区间。
样本含量为450,属于大样本,可采用正态近似的方法计算可信区间。
,,,
95%可信区间为
下限:
(g/L)
上限:
(g/L)
即该地成年男子红细胞总体均数的95%可信区间为101.26g/L~101.54g/L。
2.研究高胆固醇是否有家庭聚集性,已知正常儿童的总胆固醇平均水平是175mg/dl,现测得100名曾患心脏病且胆固醇高的子代儿童的胆固醇平均水平为207.5mg/dl,标准差为30mg/dl。
问题:
①如何衡量这100名儿童总胆固醇样本平均数的抽样误差?
②估计100名儿童的胆固醇平均水平的95%可信区间;
③根据可信区间判断高胆固醇是否有家庭聚集性,并说明理由。
①均数的标准误可以用来衡量样本均数的抽样误差大小,即
mg/dl,
②样本含量为100,属于大样本,可采用正态近似的方法计算可信区间。
,,,,则95%可信区间为
下限:
(mg/dl)
上限:
(mg/dl)
故该地100名儿童的胆固醇平均水平的95%可信区间为201.62mg/dl~213.38mg/dl。
③因为100名曾患心脏病且胆固醇高的子代儿童的胆固醇平均水平的95%可信区间的下限高于正常儿童的总胆固醇平均水平175mg/dl,提示患心脏病且胆固醇高的父辈,其子代胆固醇水平较高,即高胆固醇具有一定的家庭聚集性。
第五章t检验
一、单项选择题
1.两样本均数比较,检验结果说明D
A.两总体均数的差别较小B.两总体均数的差别较大
C.支持两总体无差别的结论D.不支持两总体有差别的结论
E.可以确认两总体无差别
2.由两样本均数的差别推断两总体均数的差别,其差别有统计学意义是指E
A.两样本均数的差别具有实际意义
B.两总体均数的差别具有实际意义
C.两样本和两总体均数的差别都具有实际意义
D.有理由认为两样本均数有差别
E.有理由认为两总体均数有差别
3.两样本均数比较,差别具有统计学意义时,P值越小说明D
A.两样本均数差别越大B.两总体均数差别越大
C.越有理由认为两样本均数不同D.越有理由认为两总体均数不同
E.越有理由认为两样本均数相同
4.减少假设检验的Ⅱ类误差,应该使用的方法是E
A.减少Ⅰ类错误B.减少测量的系统误差
C.减少测量的随机误差D.提高检验界值
E.增加样本含量
5.两样本均数比较的t检验和u检验的主要差别是B
A.t检验只能用于小样本资料B.u检验要求大样本资料
C.t检验要求数据方差相同D.t检验的检验效能更高
E.u检验能用于两大样本均数比较
二、计算与分析
1.已知正常成年男子血红蛋白均值为140g/L,今随机调查某厂成年男子60人,测其血红蛋白均值为125g/L,标准差15g/L。
问该厂成年男子血红蛋白均值与一般成年男子是否不同?
因样本含量n>50(n=60),故采用样本均数与总体均数比较的u检验。
(1)建立检验假设,确定检验水平
,该厂成年男子血红蛋白均值与一般成年男子相同
,该厂成年男子血红蛋白均值与一般成年男子不同
a=0.05
(2)计算检验统计量
==7.75
(3)确定P值,做出推断结论
7.75>1.96,故P<0.05,按α=0.05水准,拒绝,接受,可以认为该厂成年男子血红蛋白均值与一般成年男子不同,该厂成年男子血红蛋白均值低于一般成年男子。
2.某研究者为比较耳垂血和手指血的白细胞数,调查12名成年人,同时采取耳垂血和手指血见下表,试比较两者的白细胞数有无不同。
表成人耳垂血和手指血白细胞数(10g/L)
编号
耳垂血
手指血
1
9.7
6.7
2
6.2
5.4
3
7.0
5.7
4
5.3
5.0
5
8.1
7.5
6
9.9
8.3
7
4.7
4.6
8
5.8
4.2
9
7.8
7.5
10
8.6
7.0
11
6.1
5.3
12
9.9
10.3
本题为配对设计资料,采用配对检验进行分析
(1)建立检验假设,确定检验水平
H0:
md=0,成人耳垂血和手指血白细胞数差异为零
H1:
md¹0,成人耳垂血和手指血白细胞数差异不为零
a=0.05
(2)计算检验统计量
20.36
=
=3.672>,P<0.05,拒绝H0,接受H1,差别有统计学意义,可以认为两者的白细胞数不同。
3.分别测得15名健康人和13名Ⅲ度肺气肿病人痰中抗胰蛋白酶含量(g/L)如下表,问健康人与Ⅲ度肺气肿病人抗胰蛋白酶含量是否不同?
表健康人与Ⅲ度肺气肿患者α1抗胰蛋白酶含量(g/L)
健康人
Ⅲ度肺气肿患者
2.7
3.6
2.2
3.4
4.1