SAS随机分组方法及实现.docx
《SAS随机分组方法及实现.docx》由会员分享,可在线阅读,更多相关《SAS随机分组方法及实现.docx(15页珍藏版)》请在冰点文库上搜索。
SAS随机分组方法及实现
随机分组方法包括:
∙简单随机化(simplerandomization)
∙区组随机化(blockrandomization)
∙分段(或分层)随机化(stratifiedrandomization)
∙分层区组随机化(stratifiedblockrandomization)
∙动态随机化(dynamicrandomization)
一、简单随机化,又称完全随机化
1、定义:
在事先或者实施过程中不作任何限制和干预或调整,对研究对象直接进行随机分组。
通常,通过掷硬币、随机数字表、计算机产生随机数来进行随机化。
2、适用条件:
在研究例数较少、总体中个体差异较小时,采用此法。
3、缺点:
在研究对象例数较少时,由于随机误差难以保证组间病例数的均衡,各组例数可能会出现不平衡现象。
4、解决办法:
随机数表法、随机数余数分组法。
随机数余数分组法的具体操作:
编号:
研究对象(动物按体重大小、患者按预计样本量编号)从1到N编号;
获取随机数字:
从随机数字表中任意一个数开始,沿同一方向顺序每个研究对象对应取一个随机数字;
求余数:
随机数除以组数求余数。
若整除,则取组数作为余数;
分组:
按余数数值分组;
调整:
假如某组待调整,该组共有n例。
从中抽取1例,就取下一个随机数,随机数除以n。
除以n的余数(若整除则余数为n)作为在该组中所抽研究对象的序号,调整到其他组。
例1-1:
两组
对心脑病区观察20例(编号1~20)心血管病患者分为2组,一组以灯盏花注射液为治疗组,另一组给予瓜蒌薤白汤。
从随机数字表任一行开始(以第11行第1个数(57)计),按序查找,凡小于或等于20的数标记,查够10个数;
将与这10个数对应编号患者列为一组,余下患者为另一组。
57
35
27
33
72
24
53
63
94
09
.
41
10
.
76
47
91
44
04
.
95
49
66
39
60
04
.
59
81
48
50
86
54
48
22
06
.
34
72
52
82
21
15
.
65
20
.
33
29
94
71
11
.
15
.
91
29
12
.
03
.
61
96
48
95
03
.
07
第一组:
9,10,4,6,15,20,11,12,3,7;第二组:
1,2,5,8,13,14,16,17,18,19。
例1-2:
多组(≥3组)
将15名血栓性血瘀证患者分为3组。
病人编号
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
随机数字
28
26
08
73
37
32
04
05
69
30
16
09
05
88
69
余数
1
2
2
1
1
2
1
2
3
3
1
3
2
1
3
分组
甲
乙
乙
甲
甲
乙
甲
乙
丙
丙
甲
丙
乙
甲
丙
调整
丙
第一次分组后,甲组6例,乙组5例,丙组4例。
由于各组例数不等,须将甲组调整1例到丙组。
因此,继续查随机数字表,下一个随机数字为58。
由于58/6=9……4,甲组中第4个研究对象调整到丙组。
5、SAS实现
对20例病人随机分成两个等比例组,使每组为10例。
方法一:
PROC PLAN SEED=n过程。
PROCPLANSEED=210000;
FACTORSn=20;
OUTPUTOUT=patient;
RUN;
DATAresult;
SETpatient;
number=_n_;
IFn<=10THENgroup='A';
ELSEgroup='B';
RUN;
PROCPRINTdata=resultNOOBS;
VARnumbergroup;
RUN;
方法二:
UNIFORM(n)函数。
在完全随机化时,UNIFORM函数法结果的平衡性较差。
DATApatient;
DOnumber=1to20;
r=UNIFORM(210000);
OUTPUT;
END;
RUN;
PROCRANKdata=patientOUT=rank;
RANKSr_rank;
VARr;
RUN;
DATAresult;
SETrank;
IFr_rank<=10THENgroup='A';
ELSEgroup='B';
RUN;
PROCPRINTdata=resultNOOBS;
VARnumbergroup;
RUN;
二、区组随机化,又称均衡随机化、限制性随机化
1、定义:
将随机加以约束,使各处理组的分配更加平衡,满足研究要求。
在一个区间内包含一个预定的处理分组数目和比例。
区组:
由若干特征相似的试验对象组成。
如同一窝的动物、批号相同的试剂、体重相近的受试者等。
区组的长度:
区组中对象的数目。
2、优点:
区组随机化分组,避免简单随机化分组可能产生的不平衡现象,不仅提高统计学效率,而且保证分配率不存在时间趋势。
3、适用条件:
区组的长度不宜太小,太小则形成不随机。
一般区组的长度至少要求为组数的2倍以上。
区组的长度也不宜太大,太大易使分段内不均衡,
如果只有两个组别(试验组和对照组),区组的长度一般可取 4~8,如果有4个组别则区组的长度至少为8。
区组长度还与试验的疗程长短有关:
对于疗程较短的疾病,患者入组快,结束快,区组长短影响不大,而对于疗程比较长的疾病,区间长度不宜过大。
例2-1区组随机化分组(两组)
以入院时间(月份)作为配伍因素,将入院时间同月相邻的4位患者作为一个区组,试对24名患者分配到A和B两组处理。
确定区组长度和两个组的所有可能排列:
设区组长度为4,则A和B两组所有可能的排列为6。
给每种可能排列的区组分配抽样号码:
每个区组4名患者的分配方案,如下图所示。
用抽签方法随机排列上述区组分配的号码:
查随机数字表任意选择起始数,28、26、08、73、37、32,
按照从小到大排序得出上述区组分配的号码为:
3、2、1、6、5、4。
1
2
3
4
5
6
A
A
A
B
B
B
A
B
B
A
A
B
B
A
B
A
B
A
B
B
A
B
A
A
将观察单位按事先编好的病例号从1号开始按顺序进入上述抽签后得到的区组号码顺序的各区组。
分配序号
3
2
1
6
5
4
病例数号
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
分组
A
B
B
A
A
B
A
B
A
A
B
B
B
B
A
A
B
A
B
A
B
A
A
B
5、SAS实现
对24例病人按区组随机化方法分成两个等比例组,使每组为12例。
方法一:
PROC PLAN SEED=n过程。
PROCPLANSEED=210000;
FACTORSblock=6length=4;
OUTPUTOUT=patient;
RUN;
DATAresult;
SETpatient;
number=_n_;
IFlength<=2THENgroup='A';
ELSEgroup='B';
RUN;
PROCPRINTdata=resultNOOBS;
VARnumbergroup;
RUN;
方法二:
UNIFORM(n)函数。
DATArandom;
DOblock=1to6;
DOlength=1to4;
r=UNIFORM(210000);
OUTPUT;
END;
END;
RUN;
DATApatient;
SETrandom;
number=_n_;
RUN;
PROCRANKDATA=patientOUT=rank;
RANKSr_rank;
VARr;
BYblock;
RUN;
DATAresult;
SETrank;
IFr_rank<=2THENgroup='A';
ELSEgroup='B';
RUN;
PROCPRINTDATA=resultNOOBS;
VARnumbergroup;
RUN;
三、分层随机化分组
1、定义:
首先根据研究对象进入试验时某些重要的临床特征或危险因素分层,如年龄、性别、病情、疾病分期等;
然后在每一层内进行随机分组,最后分别合并为试验组(处理组)和对照组。
2、优点:
分层随机化可保证减小Ⅰ型错误,并且可以提高小样本(<400)试验的把握度。
3、适用条件:
只适合于有2~3个分层因素,分层因素较多容易出现不均衡的情况。
文献报道,通常受试对象在100~200例之间,2~3个分层因素,每个因素仅有2个水平时,应用分层随机化较恰当;
当分层因素较多时各层所含的例数会变少,容易出现各组分层因素分布和组间例数的不均衡,影响分析结果。
分层随机化分组的具体操作:
将分组过程分多个层进行,每个层有m个试验对象。
m必须是层数的整倍数,为了保证随机效果,m最好是层数的5倍以上;
取m个随机数从小到大排序,得序号R;
规定R所对应的处理,如10位患者等分为两组,则R1~5为A组,R6~10为B组;
将m个观察对象分配完毕以后,再按以上方法对下一层m个观察对象分组,直到分组结束。
例3-1分层随机化分组(两组)
将男、女各10名受试者按照性别分层后随机等分为两组。
令m= 10,需分2层(男性和女性)完成全部分组。
规定每段随机排列序号R 对应处理,R1~5为A组; R6~10 为B组。
第一层(男)随机分组结果
第二层(女)随机分组结果
序号
随机数
R
组别
序号
随机数
R
组别
1
22
3
A
1
68
6
B
2
17
1
A
2
95
10
B
3
68
9
B
3
23
2
A
4
65
8
B
4
92
8
B
5
81
10
B
5
35
3
A
6
19
2
A
6
13
1
A
7
36
5
A
7
79
7
B
8
27
4
A
8
93
9
B
9
59
7
B
9
37
4
A
10
46
6
B
10
55
5
A
4、SAS实现
同上,与区组随机化相同。
四、分层区组随机化分组
1、定义:
多中心临床试验中,普遍采用的方法是以中心分层,然后在各中心内进行区组随机化,即称为分层的区组随机化。
目前,临床试验中最多采用的是多中心、随机、对照、平行、双盲试验。
2、优点:
分层随机化可以保证组内各层之间的均衡性,区组随机化可以保证组间的可比性。
3、适用条件:
在影响因素(分层因素<3)比较少时,分层区组随机化可以保证组间均衡性;
当影响因素多时,各层所含的例数会变少,容易出现各影响因素分布和例数的不均衡。
4、SAS实现
对240例病人,按4个中心进行区组随机化分组。
方法一:
PROC PLAN SEED=n过程。
PROCPLANSEED=210000;
FACTORScenter=4 block=10 length=6;
OUTPUT OUT=patient;
RUN;
DATAresult;
SETpatient;
number=_n_;
IF length<=3 THEN group='A';
ELSE group='B';
RUN;
PROCPRINTdata=resultNOOBS;
VARnumbergroup;
RUN;
方法二:
在区组随机化SAS程序基础上,添加一个分层因素(即中心),也可以实现分层区组随机化。
在实际中,分层区组随机化应注意问题:
∙按多个因素分层的区组随机化:
临床试验中有时分层的因素可能不止1个。
例如,在某抗生素的临床试验中,按中心进行分层外,还要求按病种分为呼吸系统感染和泌尿系统感染两层。
解决方法:
可进行两次按中心分层的区组随机化,两次取不同种子数。
∙各中心例数不等的分层区组随机化
实际中医院承担的例数可能不同,可按不同的医院分别区组随机化,且分别给定不同的种子数。
∙随机化确定各中心接收的编码分段
先将若干个参加医院编码后,然后采用SAS系统中的随机函数UNIFORM(n)产生相应的随机数,
对该随机数由小到大排序,以秩次号作为选取各医院对应的编码分段的依据。
∙随机化确定药物编码
用SAS系统中的随机函数UNIFORM(n)分别产生试验组和对照组的随机数,
如试验组随机数大于对照组随机数,则试验组以A作为代码,对照组以B作为代码,否则试验组为B,对照组为A。
五、动态随机化分组
1、定义:
在临床试验的过程中每例患者分到各组的概率不是固定不变的,而是根据一定的条件进行调整的方法。
动态随机化包括:
瓮法(urn)、偏币法(biasedcoin)、最小化法(minimization)等。
在临床试验中,研究者常把患者分为试验组与对照组。
两种做法:
先来入试验组,后来入对照组。
在患病严重程度、患病时间等非实验因素方面不均衡,可能造成组间不均衡。
先来入试验组,后来入对照组,然后交叉进行。
同样,可能造成组内不均衡。
按“平衡指数最小原则”进行随机化分组,即动态随机化分组。
2、优点:
有效地保证各试验组间例数和某些重要的非处理因素接近一致。
在国外,最小化法已开始应用于实际研究并被誉为临床试验的“白金标准”。
六、随机化与盲法
1、盲法
偏倚可产生于临床试验从研究的设计到资料的分析和解释的任何阶段。
∙对于研究人员,知道某些病人采用可能不太有效的疗法,可能会采取一些补偿性的措施从而破坏研究。
∙对于研究对象,知道自己采用可能不太有效的疗法,依从性下降甚至退出试验。
∙对于效应评定人员,对于试验可能会有强烈的愿望或偏见,如果不采取预防措施,很容易产生偏倚。
随机化临床试验中控制偏倚的常用方法是采用盲法(blinding)。
只有研究对象不知道处理分配时称为单盲;研究对象和研究人员都不知道处理分配时称为双盲。
具体的盲法技术:
处理编码、双盲双模拟技术、胶囊技术、药品的包装技术、应急信件、揭盲等,可参考有关的文献介绍。
某些特殊情况,盲法是不可能的。
∙如死亡。
研究对象、效应评定者等会产生偏倚。
∙比较手术疗法(如针灸)和药物疗法,外科医生和病人不知道是不可能的。
这种情况下,可以效应评定者不知道的处理是最适当的办法。
随机化一定要与盲法配合使用,才能真正地减少偏倚。
2、随机分配方案的隐匿,又称隐秘分组
首先,产生随机分配序列和确定受试对象合格性的研究人员不应该是同一个人;
其次,最好使产生和保存随机分配序列的人员不是参与试验的人员。
具体方法:
∙按顺序编码、不透光、密封的信封 (sequentially numbered,opaque, sealed envelopes) 最常用
合格的受试对象同意进入试验时,信封才能被打开,受试对象才能接受相应的处理措施。
对于信封,存在局限:
无法检查研究者是否事先打开、通过光线可被查看。
目前,比较常用的做法是用无碳复写纸来代替按顺序、密封、不透光的信封,一旦无碳复写纸被开启后就无法还原。
∙中心随机系统 (central randomization ) 未来趋势
∙编号或编码的瓶子或容器(numbered or coded bottles or containers)
∙中心药房准备的药物(drugs prepared by the pharmacy)
随机分配方案的隐匿与盲法的区别:
随机分配方案的隐匿:
避免选择性偏倚,保证试验组和对照组基线平衡。
盲法:
在分组后实施,为了避免实施偏倚(performancebias)和测量偏倚(detection bias),因此,双盲不能代替隐蔽分组。
七、随机化与临床试验方案
临床随机对照试验的设计方案和结果报告必须写明:
∙采用什么随机方法由谁产生随机序列;
∙由谁确定随机序列的分组;
∙确定随机分配表的人是否参与纳入受试者;
∙随机分配表由谁保管及其方法。
随机分配表通常一式三份或四份,必须严密保存,不得泄密,可使用不透光信封或容器封存,
由课题负责人、研究主办者、药房以及统计师各保管一份。
揭盲或破盲时此三份或四份随机分配表必须同时当面揭封,
如其中一份或数份封口有破损,则必须予以说明,否则宣布分组信息泄密,甚至导致试验无效。
中央随机化并有严格的分组保密措施可认为隐蔽分组充分。
八、随机化与伦理道德
1、进行随机化临床实验前,认真考虑伦理道德问题。
2、对伦理道德的考虑给不做随机化临床试验提供了正当理由,而不做随机化临床试验的行为恰恰是不道德的。
参考文献
[1]万霞,刘建平.临床试验中的随机分组方法[J].中医杂志,2007,03:
216-219.
[2]胡良平,关雪,毛玮,高辉.各种常见随机化的SAS实现[J].中华脑血管病杂志(电子版),2011,01:
68-76.
[3]刘玉秀,姚晨,杨友春,陈峰.随机化临床试验及随机化的SAS实现[J].中国临床药理学与治疗学,2001,03:
193-195.