第14章研究设计二实验设计.docx

上传人:b****6 文档编号:16566324 上传时间:2023-07-14 格式:DOCX 页数:37 大小:144.24KB
下载 相关 举报
第14章研究设计二实验设计.docx_第1页
第1页 / 共37页
第14章研究设计二实验设计.docx_第2页
第2页 / 共37页
第14章研究设计二实验设计.docx_第3页
第3页 / 共37页
第14章研究设计二实验设计.docx_第4页
第4页 / 共37页
第14章研究设计二实验设计.docx_第5页
第5页 / 共37页
第14章研究设计二实验设计.docx_第6页
第6页 / 共37页
第14章研究设计二实验设计.docx_第7页
第7页 / 共37页
第14章研究设计二实验设计.docx_第8页
第8页 / 共37页
第14章研究设计二实验设计.docx_第9页
第9页 / 共37页
第14章研究设计二实验设计.docx_第10页
第10页 / 共37页
第14章研究设计二实验设计.docx_第11页
第11页 / 共37页
第14章研究设计二实验设计.docx_第12页
第12页 / 共37页
第14章研究设计二实验设计.docx_第13页
第13页 / 共37页
第14章研究设计二实验设计.docx_第14页
第14页 / 共37页
第14章研究设计二实验设计.docx_第15页
第15页 / 共37页
第14章研究设计二实验设计.docx_第16页
第16页 / 共37页
第14章研究设计二实验设计.docx_第17页
第17页 / 共37页
第14章研究设计二实验设计.docx_第18页
第18页 / 共37页
第14章研究设计二实验设计.docx_第19页
第19页 / 共37页
第14章研究设计二实验设计.docx_第20页
第20页 / 共37页
亲,该文档总共37页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

第14章研究设计二实验设计.docx

《第14章研究设计二实验设计.docx》由会员分享,可在线阅读,更多相关《第14章研究设计二实验设计.docx(37页珍藏版)》请在冰点文库上搜索。

第14章研究设计二实验设计.docx

第14章研究设计二实验设计

第14章研究设计

(二)

——实验设计

实验研究是指在控制其他因素的条件下,对实验因素之效应进行测量和评价的研究方法。

实验设计主要通过对实验因素各处理水平作出合理、有效的安排,最大限度地减少实验误差,高效、快速、经济地获得尽可能丰富和可靠的资料。

本章介绍几种较为常用的、效果较好的设计方法,包括完全随机设计、配对设计、随机区组设计、拉丁方设计、析因设计、交叉设计等。

实验设计的特点是,能够人为地设置实验因素和处理水平,通过随机化或区组化等技术控制非实验因素,提高对比组间的均衡性和可比性,适用于小样本研究。

14.1完全随机设计

14.1.1基本概念

将同质的实验对象随机地分配到研究因素各水平所对应的处理组,进行处理并观察,或从不同特征的总体中随机抽样,并对样本进行对比观察的设计方法,称为完全随机设计(completelyrandomizeddesign),又称成组设计(groupeddesign)。

完全随机设计是医学研究中使用最为广泛的设计方法之一。

本书例6.4,例6.5,例6.6均属观察指标为定量变量的完全随机设计;例7.2,例7.3,例7.4均属观察指标为定性变量的完全随机设计;例8.1,例8.2,例8.3均属观察指标为等级变量的完全随机设计。

14.1.2随机化方法

将符合条件的同质研究对象按照设计的分组概率分配到各处理组中去,或从所研究的几个总体中,按所设计的样本含量随机抽取相应的样本。

由于分组或抽样时未对研究对象进行任何控制,属完全随机的。

完全随机设计由此得名。

各处理组的分组概率可以相等,也可以不等。

比如按1:

1进行分组,此时各处理组样本含量相等;也可以按1:

2或1:

3进行分组。

在样本含量总数不变的情况下,各组样本含量相等时的设计,其统计分析效率最高。

14.1.3分析方法的选择

完全随机设计资料的分析方法取决于研究指标的性质。

对于完全随机设计的定量资料,若满足正态性和方差齐性的要求,则可根据组数选择两样本均数比较的t检验或单因素方差分析。

若样本含量不太小,即便样本所来自的总体略微偏离正态,t检验和方差分析仍然是稳健的;若总体分布极度偏离正态,或各组总体方差不等,则需酌情采用变量变换达到正态化和方差齐性后再进行分析,或者采用非参数统计学方法如Wilcoxon成组秩和检验、Kruskal-WallisH检验等。

对于等级资料,两组间的比较可采用Wilcoxon成组秩和检验,多组间比较使用Kruskal- WallisH检验。

对于定性资料,可用RC表来描述,并用2检验来进行组间比较,必要时采用确切概率法。

多组间比较时,若假设检验拒绝H0,仅说明至少有两组并非来自于同一总体。

若需进一步分析各组间的关系,需进行两两比较。

定量资料的两两比较常用的有SNK法、Dunnett法等,详见第6章;定性资料可采用Scheffé可信区间法,见第7章;等级资料可使用扩展的t检验法,见第8章。

14.1.4正确应用

(1)完全随机设计是医学研究设计中使用最为广泛的方法之一。

由于对其他因素不加以控制,故操作相对较为简单、灵活。

它可用于两组或两组以上间进行比较的情形。

(2)各组样本含量可以相等,也可以不等。

但在总样本含量一定时,样本含量相等的设计效率高于各组样本含量不等时。

故建议各组样本含量相等。

(3)由于在设计时对其他因素不加以控制,当个体同质性较差时,采用完全随机设计容易造成组间不均衡性,尤其在样本含量较少时。

此时可以考虑采用带有区组控制技术的设计方法,如配对设计或随机区组设计,等等。

(4)严格遵循随机化原则可以在一定程度上提高组间均衡性。

但在实际研究中,即便贯彻了随机抽样或随机分组原则,组间某指标仍有可能不均衡。

如在临床试验中,采用随机分组的方法,将受试者分配到试验组和对照组,而患者的病情严重程度在两组间不均衡。

这种不均衡,常常影响研究结论。

因此,在设计时需考虑到这些潜在的干扰因素并在实验过程中详细记录,在分析时需对这些因素在各组间是否均衡进行分析,若组间不均衡,则需借助于统计分析方法控制混杂因素的干扰,如分层分析、协方差分析,或其他的多元统计分析方法。

当处理组数大于2时,组间的比较需考虑多重比较的问题。

以定量资料为例,若方差分析得到了各组间差异有统计学意义的结论,则可进一步采用SNK等方法进行各组间的相互比较,或用Dunnett法进行多个实验组与一个对照组的比较。

若分组变量为时间、浓度等连续性指标的不同水平时,且各组均数与分组变量之散点图提示两者间存在某种趋势,则可以利用相关或回归分析探讨两者间的数量关系。

14.2配对设计

14.2.1基本概念

将实验单位按一定条件配成对子,再将每对中的两个实验单位随机分配到两个处理组中,这种设计方式称为配对设计(paireddesign)。

配对的因素一般是可能影响研究结果的非处理因素。

将性质相近、同质性好的实验对象配成一对,以减少抽样误差,提高检验效能。

配对设计(paireddesign)有两种常见形式,即异体配对和自身配对。

异体配对,即将两个性质相近、同质性好的实验对象配成一对进行处理或观察。

在动物实验中,常将种属、窝别、性别等特征相同的动物配成对子,再用随机化的方法将每对动物分配到处理组和对照组中去;临床试验中,常将性别相同,年龄、职业相近,病情、病型(期)等相同或相近的两个病人配成对子,再用随机化的方法将每对受试对象分配到处理组和对照组中去;人群试验中,将两个性别相同、年龄相近、生活条件或工作条件相似者配成对子,等等。

自身配对,即同一实验对象分别接受两种处理,进行自身对比。

又分几种情况:

(1)将同一实验标本一分为二,分别接受不同处理,如例7.8的设计。

(2)同一实验对象先后接受两种处理,又称自身前后配对,如给予脾切术前后门静脉压力的观察值的比较。

(3)同一实验对象身体的左右两个不同部位同时分别进行两种不同处理和对比观察,称为自身左右配对,例如,选择同一受试者的左右眼进行两种扩瞳药效果的比较。

本书例6.2和例7.8属自身配对,前者是定量的,后者是定性的;例6.3和例8.5属异体配对,前者是定量的,后者是等级的。

若受试对象的同质性较差,采用完全随机设计则可能造成组间不均衡的现象,此时抽样误差较大,检验效能较低。

尤其在样本含量不大时。

例如,在比较两种泌酸刺激剂促进胃癌病人酸排量的研究中,若两组病人本身基础泌酸水平差异较大,则刺激剂间的差异很有可能被病人间较大的异质性所掩盖。

与完全随机设计相比,由于将性质相近的实验对象配成一对(或采用自身对照),提高了同一对的两个实验对象的同质性,从而降低了抽样误差,提高了检验效能。

自身前后配对设计有时也被称为前后测量设计(premeasure-postmeasuredesign),属于重复测量设计(repeatedmeasurementdesign)的一种。

14.2.2随机分组方法

配对设计中的随机分组指的是将每个对子中的两个实验单位随机分配到两个处理组中。

实施时,先给对子内每个实验单位指定一个对内编号,再根据对子所对应的随机数进行随机分配。

14.2.3分析方法的选择

对于配对设计的定量资料,若对子内差值满足正态性的要求,则可以选择配对t检验,否则需进行变量变换或采用非参数统计学方法如Wilcoxon符号秩和检验。

对于等级资料,可采用Wilcoxon符号秩和检验。

若为定性资料,则可用McNemar’s配对2检验进行分析,必要时采用确切概率法。

14.2.4正确应用

(1)当个体间同质性相对较差时,正确使用配对设计可减少抽样误差,比完全随机设计得到更高的检验效能。

(2)配对设计的成败取决于对子中两个个体的同质性或相关性。

以两均数比较为例,不难证明:

(14.1)

式中s、r、n分别为配对的两组观察值的标准差、两组观察值的相关系数和对子数。

而在n1=n2=n条件下,完全随机设计资料两组均数差值之标准误的公式为:

(14.2)

因此,配对设计中标准误的大小取决于相关系数r。

若r>0,则配对设计的

才可能小于完全随机设计的

;若r<0,则配对设计的

大于完全随机设计的

,配对失败;若r接近0,则是配对欠佳,此时虽然完全随机设计和配对设计的标准误大小估计接近,但完全随机设计的自由度高于配对设计,故检验效能反而更高。

(3)采用自身前后配对设计要求实验前后观察时间不能间隔过长,且实验前后的各种条件要尽可能相同,如实验条件、实验对象自身的一些状况,如心理变化、疾病的自然进展等。

同时,若个体间处理前观察值相差悬殊,最好采用相对差值进行分析,即对变化率[(处理前-处理后)/处理前]的总体均数是否为0进行检验。

采用自身左右配对设计,要求各处理的作用是局部的,不能通过神经、体液或者其他的途径影响到对侧,且不同部位间除了处理不同外,其他一切条件要尽可能相同。

采用异体配对时,除一般条件齐同外,特别应当将对实验效应有影响的非研究因素包括在配对条件之内。

如:

研究药物对动脉硬化的疗效,应将血脂水平、动脉血压、饮食因素、是否吸烟、血糖等情况选为配对条件。

(4)在配对设计中,应尽可能减少缺失现象的发生。

一旦对子中的一个观察值缺失,当用配对差值进行对比分析时,另一个观察值的信息也不能被利用。

(5)采用异体配对时,配对条件不能过多、过严,否则将难于找到足够多可以配对的个体,但宽松的配对条件又可能造成配对效果欠佳。

因此,采用配对设计时,需要合理设置配对的条件。

有时配对设计结合回归分析可得到更丰富的结论,参见例18.3。

14.3随机区组设计

14.3.1基本概念

配对设计中适用于处理因素有仅有2个水平的情况。

但在医学研究中,处理因素可能包括多个水平。

例如,在一项观察实验动物的某项指标在用药前、用药后10分钟、30分钟、60分钟时的大小的研究中,处理因素共有4个水平。

若借鉴配对的思想,将性质相近的k个实验单位组成1个区组(block),将区组中的k个个体随机分配到k个不同的处理组中去,这类设计方法则称为随机区组设计(randomizedblockdesign),简称区组设计,亦称配伍组设计。

区组设计是配对设计的扩展,由R.A.Fisher于1926年提出。

当实验对象存在异质性,即同质性较差,但其中部分实验对象同质性较好时,可以采用区组设计。

若忽略这种异质性,单纯采用完全随机设计,则相应的方差分析不能将这种异质性从总变异中分离出来,只能将其视为随机误差的组成部分,从而导致方差分析模型中的随机误差被高估,致使检验效能降低。

此时,若采用随机区组设计,将同质性较好的实验对象作为1个区组,相应的方差分析模型将区组间的异质性从总变异中分解出来,从而合理地降低了随机误差的估计值,提高了检验效能。

随机区组设计也是医学研究中使用最为广泛的设计方法之一。

如在动物实验中,按处理分组的个数,选择同窝别、同性别、同体重的小白鼠组成1个区组;在比较几种配方的差异时,让同一位工人同时处理这几种配方,作为1个区组,等等。

当处理组数只有两组时,随机区组设计等价于配对设计。

14.3.2随机分组方法

随机区组设计的随机化体现为区组内随机,即分别对每个区组内的若干个个体给予随机数,再根据随机数指派给不同的处理组。

14.3.3分析方法选择

随机区组设计的定量资料,一般采用两因素的方差分析(two-wayANOVA),方差分析时将总变异分解成处理组间变异、区组间变异和误差3个部分(参见6.4.4节)。

当处理因素有统计学意义时,需进一步做处理组间的多重比较,可视具体情况使用6.4.3节介绍的q检验或q’检验。

随机区组设计的等级资料,可采用FriedmanM检验或秩变换检验(参见8.5节)。

若观察指标为定性资料,则可采用logistic回归模型或对数线性模型(参考有关多元统计分析的专著)。

14.3.4正确应用

(1)随机区组设计是配对设计的扩展。

在实验对象同质性较差时,采用区组设计可以提高各处理组间的可比性和均衡性,减少误差,提高检验效能。

(2)与配对设计的要求类似,同一区组内的个体应达到同质。

(3)当处理因素是时间、浓度等连续性指标的不同水平时,且各组均数与分组变量之散点图提示两者间存在某种趋势,结合回归分析可以提取更丰富的信息,参见例18.1和例18.2。

(4)采用区组设计时,要尽可能使观察值不缺失,虽然有相应的统计方法可以估计缺失值,但这种估计的目的仅在于充分利用同一区组内未缺失的数据,并不能挽救已经损失的信息。

因此,在缺失风险较高的一些研究中,可以考虑同一实验单元适当增加重复次数。

(5)在同质实验单位数少于处理组数时,导致区组内个体数不足以放置所有的处理水平时,可以考虑采用平衡不完全区组设计(balancedincompleteblockdesign,BIB)。

例如,有6个处理水平需要比较,但每个区组只有3个同质的实验对象,只能采用BIB设计,见表14.1。

表14.1不完全随机区组设计

区组

处理

水平1

水平2

水平3

水平4

水平5

水平6

1

2

3

4

表14.1中,由于每个区组的受试对象的个数少于处理水平数,故仅在表格中标有“”的格子中安排实验对象。

由于各处理组例数相等,各区组例数也相等,任意两个区组同时接受一种处理的个数(相遇数)也是相等的(本例相遇数为1),故此设计是平衡的。

更详细的内容请参考郭祖超(1988)的著作。

14.4拉丁方设计

14.4.1基本概念

一般的随机区组设计可以在控制1个区组因素后,研究1个处理因素各水平间的差异。

但在医学研究中,有时同时需要考虑控制两个区组因素。

如某位研究者欲比较4种不同产地的甘蓝叶样本中核黄素的浓度,但检测时的温度和操作人员的技术水平可能会影响检测的结果,此时若两个区组因素(温度、操作员)和处理因素(产地)的水平数均相等,可以使用拉丁方设计(Latinsquaredesign)。

1个拉丁方是由r个拉丁字母排成的r×r方阵,称r阶拉丁方。

方阵中的拉丁字母代表处理因素,每个字母在各行、列中只出现1次,方阵的行与列代表另外2个因素,3个因素的水平数相等。

常用的拉丁方见表14.2,在书写拉丁方时,可以先在第1行将字母按顺序写好,然后依次将每1行的字母向左移动1格。

因其是按照拉丁字母的顺序非常有规律地排列的,故称这种拉丁方为基本型拉丁方。

表14.24种不同的基本型拉丁方

33

44

55

66

A

B

C

A

B

C

D

A

B

C

D

E

A

B

C

D

E

F

B

C

A

B

C

D

A

B

C

D

E

A

B

C

D

E

F

A

C

A

B

C

D

A

B

C

D

E

A

B

C

D

E

F

A

B

D

A

B

C

D

E

A

B

C

D

E

F

A

B

C

E

A

B

C

D

E

F

A

B

C

D

F

A

B

C

D

E

拉丁方中,每1行每个字母出现且只出现1次,每1列中每个字母也出现且只出现1次,不同处理水平重复次数也是相等的,故这种设计是平衡设计。

在进行拉丁方设计时,每1行代表行区组因素的1个水平,每1列代表列区组因素的1个水平,表格中的每个字母代表研究因素的1个水平。

故1个拉丁方设计可以安排1个研究因素和2个区组因素,它是一种双向区组控制技术。

拉丁方设计中,行和列一般安排区组控制因素,方内字母安排处理因素。

例如,在动物试验中,行表示不同的窝别,列表示不同的日期,每个动物接受1种药物处理。

又如,行表示不同的动物,列表示动物的不同部位,每个动物的不同部位接受不同的处理。

14.4.2随机化方法

使用拉丁方时也必须遵循随机化原则。

所谓p阶拉丁方的随机化,即是从所有可能的p阶拉丁方中随机选择一种来安排实验。

不同阶数的拉丁方,其所有可能的拉丁方数不同。

例如,33的拉丁方有12种不同的排列;44的拉丁方有576种;55的拉丁方有161280种;66的拉丁方有812851200种;77的拉丁方有61,479,418,904,000种。

可见,要列举这些拉丁方,并从中随机抽取一个是不太可能的。

实际应用中,可以对拉丁方的行、列、字母的顺序分别进行随机化,所得到的拉丁方就可作为随机拉丁方。

有两种办法。

其一是分别对行区组因素、列区组因素和处理因素的不同水平分别进行随机排列,根据随机排列的结果顺序安排到基本拉丁方中。

其二,分别对基本拉丁方的行、列、字母进行随机排列,即可得到1个随机拉丁方。

以用上述第2种方法获得一个55的随机拉丁方为例:

对5阶拉丁方的行随机排列为2,5,4,1,3,对列的随机排列为1,3,4,2,5,对字母进行随机排列的顺序为E,B,C,A,D。

据此对5阶基本型拉丁方的行、列及字母进行调整,即得到1个随机拉丁方,具体过程和结果见表14.3。

表14.35×5基本型拉丁方的随机变换

A

B

C

D

E

行随机 

B

C

D

E

A

列随机 

B

D

E

C

A

字母随机

B

A

D

C

E

B

C

D

E

A

E

A

B

C

D

E

B

C

A

D

D

B

C

E

A

C

D

E

A

B

D

E

A

B

C

D

A

B

E

C

A

E

B

D

C

D

E

A

B

C

A

B

C

D

E

A

C

D

B

E

E

C

A

B

D

E

A

B

C

D

C

D

E

A

B

C

E

A

D

B

C

D

E

A

B

14.4.3分析方法选择

对于定量资料,可以选择3因素的方差分析。

方差分析中,总变异分解为行区组变异、列区组变异、处理组间变异和误差4个部分。

对于等级资料,可以采用秩变换检验,或有序结果变量的累积优势logistic回归进行分析;对定性资料,可以采用二分类、多分类结果变量的logistic回归分析,参见有关多元分析的专著。

14.4.4实例分析

例14.1为比较A、B、C、D、E、F6种药物给家兔注射后产生的皮肤疱疹大小(cm2),采用拉丁方设计,选择6只家兔,并在每只家兔的6个不同部位进行注射。

结果见表14.4。

表14.4 6只家兔6个不同部位注射不同药物后皮肤疱疹大小(cm2)

家兔

部位

a

b

c

d

e

f

I

C

7.9

E

8.7

D

7.4

A

7.4

F

7.1

B

8.2

II

D

6.1

B

8.2

F

7.7

E

7.1

C

8.1

A

5.9

III

A

7.5

C

8.1

E

6.0

F

6.4

B

6.2

D

7.5

IV

F

6.9

A

8.5

C

6.8

B

7.7

D

8.5

E

8.5

V

B

6.7

D

9.9

A

7.3

C

6.4

E

6.4

F

7.3

VI

E

7.3

F

8.3

B

7.3

D

5.8

A

6.4

C

7.7

这是一个6×6的拉丁方,研究因素为药物(treat),行区组因素为家兔(animal),列区组因素为部位(position)。

用3因素方差分析,结果见14.5。

结果表明,药物间无差异(P=0.9710),家兔间有差异(P=0.0124)。

表14.5例14.1资料的方差分析表

变异来源

SS

MS

F

P

处 理,药物间(treat)

0.5633

5

0.1127

0.17

0.9701

行区组,家兔间(animal)

3.8333

5

0.7667

1.17

0.3592

列区组,部位间(position)

12.8333

5

2.5667

3.91

0.0124

残差

13.1300

20

0.6565

总变异

30.3600

35

14.4.5正确应用

(1)拉丁方设计采用的是双向的区组化技术,可以安排3个因素(水平数相同)的实验;与随机区组设计相同,拉丁方设计要求行区组内的个体在行因素上同质,列区组内的个体在列因素上同质。

(2)若有3个干扰因素需要控制时,可以采用希腊-拉丁方(Graeco-Latinsquares)设计,它是三向的区组化技术,可以安排4个因素(水平数相同)的实验。

在表14.6中,行和列分别为2个区组因素,希腊字母对应于第3个区组因素,而英文字母对应于处理因素。

表14.6 5水平的基本型希腊-拉丁方

行因素

列因素

I

II

III

IV

V

1

A

B

C

D

E

2

B

C

D

E

A

3

C

D

E

A

B

4

D

E

A

B

C

5

E

A

B

C

D

(3)对于拉丁方设计和希腊-拉丁方设计,由于采用了双向或三向区组化控制技术,故所需样本含量较少。

但因此也要求观察指标的个体变异及实验误差不太大(相对于处理效应)。

如不能满足这个要求,则每个实验单元必须重复,增加样本含量,降低抽样误差。

(4)区组设计(包括拉丁方、希腊拉丁方设计)资料不可分析交互作用。

(5)拉丁方设计中,应尽可能不要有数据缺失。

(6)若区组的个体数少于处理组数,可以选用不完全设计技术,如尤登方(Youden’ssquare)设计。

5×5拉丁方

尤登方设计

A

B

C

D

E

A

B

C

D

B

C

D

E

A

去掉最后一列

B

C

D

E

C

D

E

A

B

C

D

E

A

D

E

A

B

C

D

E

A

B

E

A

B

C

D

E

A

B

C

14.5析因设计

14.5.1基本概念

很多研究中,研究者需要同时了解多个处理因素的效应,既关心各处理因素的主效应(maineffect),又关心各处理因素间的交互作用(interaction),此时可使用析因设计(factorialdesign)。

它是指对多个处理因素各水平的所有组合进行实验的一种研究设计方法。

析因设计的优点是:

它对各因素不同水平的全部组合进行实验,故具全面性和均衡性;通过该设计与数据处理,可以得到各因素不同水平的效应大小及各因素间的交互作用,且能找出各因素各水平间的最佳组合;与1次研究1个因素的实验设计方法相比,具有更高的效率,以有2个2水平的研究因素为例,采用析因设计是采用1次研究1个因素的设计之效率的1.5倍,且随着研究因素和水平的增加,效率将进一步增加。

析因设计一般以各因素的水平数以乘号相连来标注,如24设计为1个因素

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > PPT模板 > 商务科技

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2