非参数统计学讲义第四章多样本模型.docx
《非参数统计学讲义第四章多样本模型.docx》由会员分享,可在线阅读,更多相关《非参数统计学讲义第四章多样本模型.docx(36页珍藏版)》请在冰点文库上搜索。
![非参数统计学讲义第四章多样本模型.docx](https://file1.bingdoc.com/fileroot1/2023-5/10/adc36566-892d-45cb-98cc-1cd7e9cff268/adc36566-892d-45cb-98cc-1cd7e9cff2681.gif)
非参数统计学讲义第四章多样本模型
非参数统计学讲义
主讲:
统计系袁靖
第四章多样本模型
§1k个相关样本的非参数检验
在参数统计中,检验几个样本是否来自完全相同的总体,采用方差分析或F检验。
运用F检验的假定
条件是:
样本是从正态分布的总体中独立抽选的;总体具有相同的方差;数据的测量层次至少是定距尺度。
当被用来分析的数据不符合这些假定条件,或研究者不希望作这些假设,以便增加结论的普遍性时,不宜采用参数统计的方法,而必须运用非参数方法。
如果k(等于或大于3)个样本是按某种或某些条件匹配的,那么k个样本称为相关的,否则为独立
的。
k个相关和独立样本的差别与两个相关和独立样本之间的差别类似。
本节介绍k个相关样本的非参数
检验。
一、CochranQ检验
1•研究背景
CochranQ检验也译为科库兰检验。
它是用以检验匹配的三组或三组以上的频数或比例之间有无显著
差异的方法。
这种匹配可以用不同形式获得。
例如,检验三种不同类型的采访形式对被采访者的有效回答
是否有影响,可以抽选一些人,分成n组,每组有3个匹配的被采访者,要求他们的有关情况相同。
每组
的3名成员被随机地置于3种条件之下,即分别接受三种类型的采访,于是,就获得了3个匹配的样本,
即k=3,每个样本有n个观测结果。
k个相关样本也可以采用同一组人,对不同的k个条件的反应匹配成
样本,这类似于两个相关样本中以研究对象作为自身的对照者。
例如,检验几种教学手段对学生掌握知识是否有显著不同,可以随机抽取n个学生,让他们先后置于k种教学手段之下,再作出评价。
这样可以获
得k个匹配的样本,每个样本有n个观测结果。
在现实生活中,很多数据是以二元数据的形式出现的,
【例4-1】村民对四个候选人的评价得到结果:
表4-1村民评价结果
处
理
区组:
20个村民对A、B、
C、
D四个候选人的评价
Ni
A
0
1
1
0
0
1
1
111
1
1
1
1
1
1
0
1
1
1
16
B
1
1
0
0
0
1
1
111
0
1
1
0
1
1
0
0
0
0
11
C
0
1
1
1
1
0
0
001
0
0
0
1
1
0
1
0
1
0
9
D
0
0
0
0
1
1
0
010
0
0
0
1
0
1
1
0
0
0
6
Lj
1
3
2
1
2
3
2
2
3
3
1
2
2
3
3
3
2
1
2
1
42
其中:
1表示同意;0表示不同意。
关心的问题是候选人在村民眼中有无区别,即检验Ho:
二=...2二川二加
是否成立,此时如果使用Friedman秩和检验将会遇到麻烦,因为有很多打结现象存在。
2•基本方法
若有k个相关样本,每个样本有n个观测结果,检验k个样本问是否有显著差异,可以建立双侧备择,
假设组为
Ho:
k个样本间无显著差异
H1:
k个样本间有显著差异
由于三个及三个以上样本间差异的方向不便于判定,因而,通常只建立双侧备择进行检验。
为对假设作出判定,所分析的数据测量层次为定类尺度即可。
获得的数据可排成一个n行k列的表。
如果Ho为真,那么将测量结果分为“成功”和“失败”的话,“成功”与“失败”应随机地分布在表中的
各行各列。
CochranQ检验的统计量定义为
121
I
』丿一
nn
八w7yi2
i1i1
式中,Xj是第j列的总数,yi是第i行的总数。
kk
k(k一1)'二(Ni-N)2k(k一1)'二N;—(k-1)N2
Q」b(0.2)
kNL2kN-、L2
j±j±
_1
式中,k为处理数;b为区组数;N为行总和;Lj为列总和;N=»Ni=»jLj;N=—7小『
k
由于Q统计量的抽样分布近似为自由度df=k一1的2分布,所以根据自由度df=k一1,给定的显
著性水平:
,能够在附表中查找临界值2,若
Q-2
则在显著性水平:
下拒绝H。
,表明样本之间存在着显著差异。
相反,则不能拒绝H。
。
3•使用说明
1运用CochranQ检验时应注意,只有当行数n不太小时,Q的抽样分布才近似于df=k一1的2分布。
但是,n的最小数值日前并没有明确的说明,使用者采用时视具体问题而定。
2CochranQ检验适用于定类尺度测量的数据,其它测量层次的数据也可以运用,但要象例4-2那样,
CochranQ检验一般只用于定类尺度的数据。
转化为两类,但这样做可能浪费数据中包含的信息。
因此,
4•应用
【续例4-1】候选人的例子
22222
2
=9.35a7.815=3°.05(3)
43(161196)-342
2277l2~
442「(1-3|||21)
因而,拒绝原假设,认为这4位候选人在选民眼中不同。
【例4-2】消费者对饮料的爱好是否存在差异
某商店为决定经营饮料的品种、数量,对消费者的爱好进行了一次调查。
随机抽取18个消费者,请
他们对四种饮料:
热牛奶、酸奶、果汁、可口可乐的喜好作出评价,凡喜好的记作1,不喜好记作0。
调
查结果如表4—2。
表4-2消费者对饮料喜好的调查结果
消费者
热牛奶
酸奶
果汁
可口可乐
合计(yi
1
1
0
0
1
2
2
0
0
1
0
1
3
0
0
1
1
2
4
1
1
0
0
2
5
1
0
1
0
2
6
0
1
0
0
1
7
0
0
0
1
1
8
0
1
0
0
1
9
0
1
1
0
2
10
1
1
1
0
3
11
0
0
1
0
1
12
0
0
1
0
1
13
1
0
0
1
2
14
1
1
0
0
2
15
1
1
0
0
2
16
0
1
0
0
1
17
1
0
0
1
2
18
0
0
0
1
1
合计(Xj)
8
8
7
6
29
分析:
为检验消费者对四种饮料的爱好是否有差异,建立双侧各择,假设组为
Ho:
消费者对四种饮料爱好无显著差异
H1:
消费者对四种饮料爱好有显著差异
由于数据为定类尺度测量,只有“爱好”与“不爱好”两种结果,且是两个以上相关样本,这里是四种饮料,k=4,所以选用CochranQ检验。
根据表4—1的调查数据,计算H。
成立时的统计量Q。
禺=8表示喜欢第一种饮料热牛奶的总次数,
4
X2=8是喜欢酸奶的总次数,其它的依此类推。
'kj=29是所有四种饮料中,消费者表示喜欢的总次数。
yi是第i个消费者喜欢各种饮料的次数。
4k
、V\-29,是各个消费者对四种饮料表示喜欢的总次数。
Xj表
j4V
示按样本数计算的消费者喜欢的总次数,
n
而vyi表示按观察对象即消费者或说按样品数计算的对各种饮料
i4
喜欢的总次数。
这两个总和应相等,即有
kn
^Xjyi。
统计量Q正是用于说明按样本数计算的总次数与
j4iJ
按样品数计算的总次数的符合程度。
按
(4.1)式,可以计算出
Q=0.5238
根据给定的显著性水平:
=0.05,自由度df=4—I=3,查附表,得到临界值2=7.82。
显然,Q=0.5238
V2-=7.82。
因而,调查数据在5%的显著性水平上不能拒绝Ho,即消费者对四种饮料的爱好没有显著
差异。
【例4-3】三种不同教学方法的效果是否有显著差异
三种不同教学方法:
电视教学、课堂讲授、课堂讨论,对学生掌一握知识的效果是否有所不同。
为检
验这一问题,抽选部分学生分为18组,每组3名匹配的学生,他们的有关情况类似。
各组中3名学生被
随机地置于3种条件下,即随机地指定接受某种教学方法。
实施不同教学方法后进行测验,成绩合格为有效,记作1;成绩不合格为无效,记作0。
结果如表4—3。
表4-3实施不同教学方法的学生成绩
学生组
电视教学
课堂讲授
课堂讨论
合计(yi
1
0
0
0
0
2
0
1
1
2
3
0
1
0
1
4
0
0
0
0
5
1
0
1
2
6
0
1
1
2
7
0
1
1
2
8
0
1
0
1
9
1
0
1
2
10
0
0
0
0
11
0
1
1
2
12
0
1
1
2
13
0
1
1
2
14
0
1
1
2
15
0
1
1
2
16
1
1
1
3
17
0
0
1
1
18
0
1
1
2
合计(Xj)
3
12
13
28
分析:
学生的考试成绩是定距尺度测量,这里将其转化为合格、不合格两类,则视为定类尺度。
合格
即教学方法有效为1,不合格为教学方法无效,记作0。
接受三种不同教学方法的学生在每一组是匹配的,
即构成3个相关样本,k=3。
检验三种教学方法的效果是否存在差异,建立的假设组为
Ho:
三种教学方法的效果无显著差异
Hi:
三种教学方法的效果有显著差异
由于是定类尺度测量的数据,相关样本数目大于2,因此,宜采用CochranQ检验。
利用表4—2的数据计
算检验统计量Q=13
给定显著性水平:
.=0.05,df=3—1=2,查附表中相应临界值2=5.99。
显然,Q=13>2=5.99,
在5%的显著性水平上调查数据拒绝H。
,表明三种不同教学方法的效果有显著差异。
最后的判定,还可以
采用这种方法,计算其尾概率。
5.软件处理
二、Friedman检验
Friedman检验亦称佛利得曼的2检验。
或佛利得曼双向评秩方差分析,或者Friedman秩和检验。
它
是对k个样本是否来自同一总体的检验。
k个样本是匹配的,实现匹配的方法与前面类似。
可以是k个条
件下同一组受试者构成,即受试对象作为自身的对照者,也可以将受试者分为n个组,每组均有k个匹配
的受试者,随机地将k个受试者置于k个条件之下形成。
在不同受试者匹配的样本中,应尽量使不同受试者的有关因素匹配即相似。
1.基本方法
与CochranQ检验相似,Friedman检验也是用来检验各个样本所得的结果在整体上是否存在显著差异。
因此建立的也是双侧备择,假设组为
H0:
k个样本间无显著差异或者H0:
?
1=川=耳
H1:
k个样本间有显著差异比:
不全相等
为对假设作出判定,所分析的数据应是定序尺度测量。
获得的数据排成一个n行k列的表,行代表不
同的受试者或匹配的受试小组,列代表各种条件。
由于是定序尺度测量的数据,因此,可以对每一行的观测结果分别评秩,即评等级,等级1是最小的,依次排序,秩从1到k。
如果H。
为真,那么每一列中秩的
分布应该是随机的,即各个秩出现在所有列中的频数应几乎相等,也就是说各列的秩和应该大致相等。
STEP1:
在每一个区组中计算各个处理的秩:
Rj;
b
STEP2:
计算秩和R='Ri=1,2,|||,k;
I
STEP3:
定义Friedman检验统计量为。
(0.3)
12R2_3b(k1)
bk(k1)ia
NOTE:
①Q越大对H0越不利;
2在小样本时,要查临界值表,查表时,要作变换W—;
b(k—1)
3在大样本时,有Q的抽样分布在n、k不太小时,近似于自由度df=k—I的2分布,即
Q~2(k-1),k定,b——。
因此,在附表中,可以根据给定的显著性水平「,自由度df=k一1查得Ho为真
时,相应的临界值2。
若2_2,则在「水平上拒绝H0,否则不能拒绝Ho;
4某区组中存在结时,Q应作适当的修正。
2•应用
【例4-4】在不同的城市对不同的人群进行血液中铅含量测试。
设有AB、C三个城市(汽车密度不同)
代表三种不同的处理(k=3),对试验者按职业分组(b=4)取血(四个区组)。
他们血液中铅含量及其评秩的结果如下:
表4-4不冋城市居民血液铅含量评秩
城市
职业
(区组)
R
(处理)
I
n
出
IV
A
80(3)
100(3)
51
(2)
65(3)
11
B
52
(2)
76
(2)
52(3)
53
(2)
9
C
40
(1)
52
(1)
34
(1)
35
(1)
4
由此可以计算出Q=6.5(W=0.8125)
【例4-4】三种不同教学方法的效果是否有显著差异
三种不同教学方法同例4-2,抽选的学生也分为18组,每组3名匹配的学生,其有关情况类似。
各组
中3名学生被随机地安排接受某种教学方法。
实施不同教学方法后,进行测验,按成绩高低对3名匹配学
生的成绩排列等级即评秩,结果如表4—4。
表4-4
实施不冋教学方法的学生成绩
学生组
电视教学
课堂讲授
课堂讨论
1
1
3
2
2
1
2
3
3
2
3
1
4
3
2
1
5
2
1
3
6
1
3
2
7
1
2
3
8
2
3
1
9
2
1
3
10
2
1
3
11
1
3
2
12
1
3
2
13
1
2
3
14
1
3
2
15
1
2.5
2.5
16
1
2
3
17
1
2
3
18
1
2
3
合计(Rj)
25
40.5
42.5
分析:
这个问题与例4-3类似,也是检验三种教学方法的效果,有无差异,因而应建立双侧备择,假
设组为
Ho:
三种学方法的效果无显著差异
Hi:
三种教学方法的效果有显著差异
表4-4实施不同教学方法的学生成绩等级由于数据的测量已转化为定序尺度,且是两个以上相关样本,
故可以来用Friedman检验。
根据表4—4的数据勺,按(4.3)式计算检验统计量2
2=10.8
给定显著性水平:
-=0.05,自由度df=k—l=2,查附表中Ho成立时相应的临界值2=5.99。
显然,
2=10.8>=5.99,因此数据在5%的显著性水平上拒绝H0,三种教学方法的效果有显著差异。
【例4-5】四部分技术训练的有效性有无差异
某田径队对新入队的学员要进行四个部分的技术训练,以提高学员的身体素质。
为检验这四个部分的
技术训练计划是否确实有效,随机抽选了
14名新学员,分别接受四个部分的训练。
每一训练结束后,均
4-5。
进行该部分的测验,成绩以10分为最高。
检测结果如表
因此排序时,取秩2和3的平均值,均记为2.5
10
3
4
10
3
8
4
6
3
10
4
5
3
4
10
6
6
5
4
6
7
7
7
10
6
5
8
6
10
3
5
9
10
5
7
6
10
8
9
7
6
11
5
4
2
6
12
3
5
4
7
13
4
5
10
9
14
6
5
8
10
分析:
学员的测验成绩是定距尺度测量的,但可以将其转换为定序尺度。
将每一学员的4个成绩,按
由低到高的顺序排列,给出等级即评秩,得到表4一5。
由于是两个以上相关样本,且数据为定序尺度,
故可以运用Friedman检验。
建立的假设组为
Ho:
四个部分技术训练的有效性无显著差异
Hi:
四个部分技术训练的有效性有显著差异
根据表4—5的数据,按(4.2)计算得到
2=0.7714
在附表中,查找与显著性水平:
-=0.05,自由度df=k—1=3相对应的临界值2=7.82。
显然Q
=0.7714V2.=7.82,调查结果在5%的显著性水平上不能拒绝H。
,表明四个技术训练的有效性没有
显著差异。
3.软件处理
Variable
FriedmanANOVAandKendallCoeff.ofConcordance(例4-3.sta)
ANOVAChiSqr.(N=18,df=2)=10.33803p<.00569
Coeff.ofConcordance=.28717Aver.rankr=.24524
AverageRank
Sumof
Ranks
Mean
Std.Dev.
电视教学
1.388889
25.00000
1.388889
0.607685
课堂讲授
2.250000
40.50000
2.250000
0.732642
课堂讨论
2.361111
42.50000
2.361111
0.763228
Variable
FriedmanANOVAandKendallCoeff.ofConcordance(例4-4
ANOVAChiSqr.(N=14,df=3)=.7714286p<.85629
Coeff.ofConcordance=.01837Aver.rankr=-.0571
AverageRank
Sumof
Ranks
Mean
Std.Dev.
技术训练'
2.357143
33.00000
5.642857
2.468483
技术训练:
?
2.357143
33.00000
5.857143
2.656115
技术训练:
2.571429
36.00000
6.500000
2.738613
技术训练
2.714286
38.00000
6.500000
1.786703
三、CochranQ检验与Friedman检验
这两个检验都用于k个相关样本是否可能来自同一个总体的检验。
但对数据测量层次的要求不同。
CochranQ检验适用于定类尺度的测量数据,其它测量层次的数据也可以使用,但应转化为两类数据。
有时观察值是以"是”或"否”,"喜欢”或"不喜欢”等二元数据的形式出现,如果用Friedman秩和检验
将会出现很多打结的现象,即秩相同。
CochranQ检验就解决了打结的问题。
但当数据为定类尺度测量,只能运用CochranQ检验。
因为,这一检验对于定类尺度或仅分为两类的
定序尺度测量数据是极为有效的。
若数据测量层次至少为定序尺度时,应优先选用Friedman2检验。
因
为若将定序尺度转换为定类尺度,而采用CochranQ检验,可能会浪费数据包含的信息
四、区组设计的另外两种检验:
Page检验和Durbin检验
1.完全区组设计的Page检验
对于单边检验问题H°r呻1=3,已:
二,Page于1963年引入下面统计量:
k
(0.4)
=xiRi
i土
式中R为秩%在第j个区组中的秩和
NOTE:
①L值越大对Ho越不利;
见笔记;
③存在打结时,需要进行修正。
【续例4-4】血液中含铅量的例子
这里将城A和C对调,即检验H0:
二-*T:
二":
:
乙-鸟。
R1=4,Rz=9,R)=1
所以,L=4192113=55,查表得,P(L_5)=0.01:
:
:
0.05,拒绝原假设,认为有显著性影响。
正态近似计算,Z=匸^=5「8=2.475>1.96。
血V3/3
2.不完全区组设计的Durbin检验
考虑平衡的不完全区组设计BIBD(k,b,r,t,■),检验H0:
二=rk,已:
不全相等。
Durbin于1951年
提出检验统计量为:
(0.5)
»単0\_3)2
rk(tT)i士2
可以使用下面的简化计算:
12(k_1)
2
rk(t—1)锂
k
、R2-
3r(k_1)(t1)
t—1
(0.6)
在原假设成立时,D统计渐近服从2(k-1)
b=4)的磨损,数据可以记为下面两种形式:
表4-6a
不完全区组设计举例
材料
部位
(区组)
R
(处理)
I
n
出
IV
A
34
(1)
28
(1)
36
(1)
3
B
36
(2)
30
(2)
45
(1)
5
C
40(3)
48
(2)
60(3)
8
D
44(3)
54(3)
59
(2)
8
【例4-6】比较四种材料(k=4)在四个部位(
解:
部位
(区组)
I
n
出
V
34(A)
30(B)
48(C)
59(D)
36(B)
28(A)
54(D)
60(C)
40(C)
44(D)
36(A)
45(B)
表4-6b不完全区组设计举例
从右边的表容易看出BIB设计的平衡性质,这里
(k,b,r,t,,)=(4,4,3,3,2)。
Z2
3r(k—1)(t1)
t-1
=6.75>6.25=爲1⑶
拒绝原假设,认为在10%的显著性水平下,不同材料的磨损情况存在区别。
§2k个独立样本的非参数检验
一、Kruskal-Wallis检验
Kruskal—Wallis检验亦有译为克拉夏尔一瓦里斯检验,或简称为克氏检验。
它是两个独立样本Mann
—Whitney—Wilcoxon检验的一种推广。
1•问题的提出
【例4-7】在一项健康试验中,有二种生活方式,减肥效果如下表,冋:
每种生活方式的减肥效果:
否相同?
表4-7
减肥效果表
生活方式
1
2
3
3.7
7.3
9.0
一个月后
3.7
5.2
4.9
减少的重量
3.0
5.3
7.1
(单位500g)
3.9
5.7
8.7
2.7
6.5
山=
5
5
4
更为一般的数据形式为:
表4-8
一般的数据结构
1
2
k
Xii
X21
Xk1
xi2
X22
Xk2
x1ri
x2门2
Xg
在数理统计学中,应作单因素方差分析
原假设:
Ho:
叫=「2
检验统计量:
FSSA二
迟ni(xix)2/k-1
-~F(k-1,N—k)
SSE
•——(xij-xi)