20.同一双变量资料,进行直线相关与回归分析,有B
(A)r>0,b<0(B)r>0,b>0(C)r<0,b>0(D)r=b
二、填空题12分
1、统计资料按其性质不同,通常将资料分为(计量、计数、等级)三种类型。
2、统计工作步骤通常为统计设计、搜集资料、整理资料和分析资料四步,其中统计分析常分为(统计描述)与(统计推断)两个阶段。
3、计量资料,随着样本例数的增大,S逐渐趋向于(a),逐渐趋向于(0)。
4、变异系数常用于比较(单位不同)或(均数相差较大)情况下两组资料的变异度。
5、(相关分析)侧重于考察变量之间相关关系密切程度,(回归分析)则侧重于考察变量之间数量变化规律。
6、对某地一年级12名女大学生体重(x:
单位kg)与肺活量(y:
单位L)的数据作相关分析,经检验两者间有直线相关关系,作回归分析得回归方程为:
?
=+,这意味着体重每增加1kg,肺活量平均增加);且两者之间为(正)相关。
三、名词解释13分
1.参数和统计量2.概率3.计数资料4.回归系数答案见书本相应的位置
四、简答题15分
1.抽样研究中如何才能控制或减小抽样误差?
答:
合理的抽样设计,增大样本含量。
2.何谓抽样误差?
为什么说抽样误差在抽样研究中是不可避免的?
答:
由抽样造成的样本统计量与样本统计量,样本统计量与总体参数间的差异
因为个体差异是客观存在的,研究对象又是总体的一部分,因此这部分的结果与总体的结果存在差异彩是不可避免的
3.能否说假设检验的p值越小,比较的两个总体指标间差异越大?
为什么?
答:
不能,因为P值的大小与总体指标间差异大小不完全等同。
P值的大小除与总体差异大小有关,更与抽样误差大小有关,同样的总体差异,抽样误差大小不同,所得的P也会不一样,抽样误差大小实际工作中主要反映在样本量大小上。
五、计算分析题
1、根据列表原则,对下表进行改进,要求绘出合格的统计分析表。
年份
病例数
存活数
住院期死亡
总数
急性期死
亡数
住院期总病
死率(%
急性期病死
率(%
1964
17
9
8
7
1965
13
8
5
4
1966
15
8
7
6
1967
15
9
6
6
1968
12
8
4
4
合计
72
42
30
27
修改表:
某年某地1964-1968年某病住院期与急性期病死率比较
1964
17
8
7
1965
13
5
4
1966
15
7
6
1967
15
6
6
1968
12
4
4
合计
72
30
27
2、现有一临床试验数据,有5家医院参加,分为试验组(g=1)和对照组(g=0),见表1,请对该资料进行分析(只要写出具体的分析内容和统计分析方法名称即可)
表1某新药临床试验部分指标
医院代码
性别身高
体重
疗效
组别
1
1
3
0
1
2
2
0
1
1
2
1
1
2
3
0
2
4
0
2
2
1
1
2
1
1
2
0
5
1
2
0
5
2
2
1
分析:
两组入组条件的均衡性比较,两组性别是否可比,可用卡方检验;两组入组的身高与体重是否可比可用两样本的t检验或u检验。
两组疗效比较可用秩和检验。
第三套试卷及参考答案
一、选择题20分
其卡方值的自由度为__C
A.8
D.跟样本含量有关
7.假设检验中的第一类错误是指_A』犯的错误
A.拒绝了实际上成立的H0B.不拒绝实际上成立的H
C.拒绝了实际上不成立的H0D.不拒绝实际上不成立的Ht
8.样本含量固定时,选择下列哪个检验水准得到的检验效能(1-B)最高_D—
A.B.C.D.
9.两样本均数的t检验对资料的要求是_D___
A.正态性、独立性、方差齐性B.资料具有代表性C.为定量资
料D以上均对
10.四个率的比较的卡方检验,P值小于,则结论为_D__
A四个总体率均不相等;B四个样本率均不相等;
C四个总体率之间肯定不等或不全相等;D四个总体率之间不等或不全相等。
二、名词解释10分
1相关系数;2抽样误差;3变异系数;4总体参数;5率;答案:
见书上相应的地方
三、填空题10分
1、常用的四种概率抽样方法有:
单纯随机抽样,机械抽样(系统抽样),分层抽样,整群抽样
2、统计推断的内容主要包括参数估计和假设检验。
3、临床观察7名某病患者,其潜伏期(天)各为:
3,7,9,5,6,9,16,则其全距为13天。
4、20名观察对象皮下注射某菌苗,一段时间后进行抗体滴度测定,其结果为:
⑴有效⑵无效⑶有效(4)有效……(20)无效,这种资料属于何种类型资料计数资料。
5、实验研究的基本要素是:
处理因素、受试对象、实验效应
四、简答题20分
1.在秩和检验中,为什么在不同组间出现相同数据要给予“平均秩次”,而在同一组的相同数据不必计算平均秩次?
答:
这样编秩不影响两组秩和的计算,或对两组秩和的计算不产生偏性。
2某医生用某药治疗10例小儿支气管哮喘,治愈8例,结论为“该药对小儿支气管哮喘的治愈率为80%,值得推广”。
答:
一是没有对照组,二是样本例数太少,抽样误差大,可信区间宽。
3.某地1岁婴儿平均血红蛋白95%可信区间为〜(g/L),表示什么意义?
该地1岁正常婴儿血红蛋白95%的参考值范围为~(g/L),又说明了什么含义?
答:
表示该地1岁婴儿血红蛋白总体平均数在〜(g/L),估计正确的概率为95%
表示该地有95%1岁正常婴儿的血红蛋白值在〜(g/L)
4对同一组资料,如果相关分析算出的r越大,则回归分析算出的b也越大。
为什么?
答:
没有这个规律。
相关分析r值大小仅说明变量间联系紧密,而回归分析b的大小说明两者数量关系。
五、分析计算题40分
1.为考察出生时男婴是否比女婴重,研究者从加州大学伯克利分校的儿童健康与发展研究中心随机抽取了12例白种男
婴和12例白种女婴的出生资料(单位:
磅)。
男婴x1
女婴x2
(1)该资料是数值变量资料还是分类资料?
数值变量资料
(2)要比较白种人男性与女性的出生体重是否不同,应当选用成组t检验还是配对t检验?
成组t检验
(3)经过计算t值为,已知自由度22时,双侧面积对应的t界值为,自由度11时,双侧面积对应的t界值为。
试写出假设检验的全过程并下结论。
答:
HO:
白种人男婴与女婴的出生体重是相同的即□仁(12
H1:
u1工口2a=
在a=水平上拒绝HO,认为白种人男婴与女婴的出生体重是不同的,男婴重于女婴
2.某医院用甲、乙两种疗法治疗单纯性消化不良,结果下表。
疗法
治疗人数
治愈人数
未愈人数
治愈率(%
甲
33
26
7
乙
38
36
2
合计
71
62
9
(1)请计算最小的理论数。
Tmin=9*33/71=
⑵若要比较两疗法治愈率是否相等,请问用何种检验方法?
四格表校正卡方检验
(3)已知检验统计量为,请下结论。
因x2=<,P>
结论:
在a=水平上接受检验假设,可认为两种治疗方法的治愈率差异无统计学意义。
3比较缺氧条件下猫和兔的生存时间(时间:
分)
猫
兔
生存时间
秩次
生存时间
秩次
25
14
1
34
10
15
2
38
11
16
3
40
12
18
4
41
13
25
42
14
26
7
45
15
28
8
30
9
(1)该资料属于什么试验设计方式?
完全随机设计两样本资料的比较
(2)对资料进行编秩;见表
(3)该资料总秩和为多少?
各组的实际秩和各为多少?
总秩和:
120,猫组:
兔组
(4)写出对该资料进行假设检验的假设。
H0:
两组生存时间的总体分布是相同的。
4.请完成以下空白并进行描述性分析。
年龄(岁)
人口数
死亡总
数
恶性肿瘤死
亡数
恶性肿瘤死亡占总
死亡的%
恶性肿瘤死亡率
(1/10万)
年龄别死亡率
(%。
)
0-
82920
()
4
()
()
20-
()
63
()
()
40-
28161
172
42
()
()
()
60-
()
()
32
()
()
()
合计
167090
715
90
()
()