因子方差分析的试验设计.docx
《因子方差分析的试验设计.docx》由会员分享,可在线阅读,更多相关《因子方差分析的试验设计.docx(14页珍藏版)》请在冰点文库上搜索。
因子方差分析的试验设计
试验设计
一、试验设计的基本概念与正交表
(一)试验设计
产品质量的好坏很大程度上是由设计所决定的,因此在新产品的开发设计阶段就要十分重视。
当然设计的好产品要成为真正高质量的产品,在生产过程中还得有好的工艺参数,为此经常需要进行试验,从影响产品两的一些因素中去寻找好的原料搭配,好的工艺参数搭配等,这便是多因素(因子)的试验设计问题。
多因素试验遇到的最大困难时试验次数太多,让人无法忍受。
如果有10个因子对产品质量有影响,每个因子取两个不同水平进行比较,那么就有210=1024个不同的试验条件需要比较,假定每个因子取三个不同水平比较的话,那么就有310=59049个不同的试验条件,要全部做试验在实际中是不大可能的,因此我们只能从中选择一部分进行试验。
选择哪些条件进行试验十分重要,这便是试验的设计。
一个好的设计,可以通过少量试验获得较多的信息,达到试验的目的。
试验设计的方法有许多,这里介绍的正交实验设计便是其中的一种常用方法,它利用“正交表”选择试验条件,并利用正交表的特点进行数据分析,找出最好的或最满意的试验条件。
(二)正交表
表2.3-1是一张典型的正交表L9(34),这里“L”是正交表的代号,“9”表示表的行数,在试验中表示用这张表安排试验的话,要做9个不同条件的试验,“4”表示表的列数,在试验中表示用这张表安排试验的话,最多可以安排4个因子,“3”表示表的主题只有3个不同的数字:
1,2,3,在试验中它代表因子水平的编号,即用这张表安排试验时每个因子应取3个不同水平。
表2.3-1L9(34)
列号
试验号
1
2
3
4
1
1
1
1
1
2
1
2
2
2
3
1
3
3
3
4
2
1
2
3
5
2
2
3
1
6
2
3
1
2
7
3
1
3
2
8
3
2
1
3
9
3
3
2
1
正交表具有正交性,这是指它有如下两个特点:
(1)每列中每个数字重复次数相同。
在表L9(34)中,每列有3个不同数字:
1,2,3,每一个出现3次;
(2)将任意两列的同行数字堪称一个数对,那么一切可能数对重复次数相同。
在表L9(34)中,任意两列有9中可能的数对:
(1,1),(1,2),(1,3),(2,1),(2,2),(2,3),(3,1),(3,2),(3,3),每一对出现一次。
如果将试验条件堪称试验空间(一起可能试验条件组成的集合)中的一点,那么正交表的这两个特点使所选择的试验点在试验空间中的分布是均匀分散的,并将看到试验结果具有综合可比性,以为以后的统计分析带来了便利。
常用的正交表有两大类。
若计一般的正交表为Ln(qp),则:
一类正交表的行数n,列数p,水平数q间有如下关系:
n=qk,k=2,3,4,…,p=(n-1)/(q-1)(2.3-1)
如二水平正交表L4(23),L8(27),L16(215),L32(231)等,三水平正交表L9(34),L27(313)等,四水平正交表L16(45)等,五水平正交表L25(56)等,这一类正交表不仅可考察各因子对试验指标的影响,有的还可考察因子间的交互作用的影响。
另一类正交表的行数,列数,水平数之间不满足(2.3-1)中的两个关系,往往只能考察各因子的影响,不能用这些正交表来考察因子间的交互作用。
如二水平正交表L12(211),L20(219)等,三水平正交表L18(37),L36(313)等,混合水平正交表L18(2×37),L36(23×313)等。
附录2给出了常用的正交表。
二、无交互作用的政教实验设计与数据分析
下面通过一个例子来叙述利用正交表安排试验与进行数据分析的步骤。
【例2.3-1】磁鼓电机是彩色录像机磁鼓组建的关键部件之一,按质量要求其输出力矩大于0.0210N·m。
某生产厂过去这项指标的合格率较低,从而希望通过试验找出好的条件,以提高磁鼓电机的输出力矩。
(一)试验的设计
在安排试验时,一般应考虑如下几步:
(1)明确试验目的,在本例中试验的目的是提高磁鼓电机的输出力矩。
(2)明确试验指标:
试验指标用来判断试验条件的好坏,在本例中直接用输出力矩作为考察指标,该指标越大,表明试验条件越好。
(3)确定因子与水平:
在实验前首先要分析影响指标的因子是什么,每个因子在试验中取哪些水平。
在本例中,经分析影响输出力矩的可能影子有三个,它们是:
A:
充磁量B:
定位角度C:
定子线圈匝数
根据各因子的可能取值范围,经专业人员分析研究,决定在本试验中采用的水平如表2.3-2所示。
表2.3-2因子水平表
因子
水平1
水平2
水平3
A:
充磁量(10-4特)
900
1100
1300
B:
定位角度(度)
10
11
12
C:
定子线圈匝数(匝)
70
80
90
(4)选用合适的正交表,进行表头设计,列出试验计划:
首先根据在试验中所考察的因子水平数选择具有该水平数的一类正交表,再根据因子的个数具体选定一张表。
在本例中所考察的因子都是三水平的,因此选用三水平正交表,又由于现在只考察三个因子,所以选用L9(34)即可。
选定了正交表后吧因子放到正交表的列上去,成为表头设计。
在不考虑交互作用的场合,可以把因子放在任意的列上,印个因子占一列。
譬如在本例中将三个因子分别置于前三列,将它写成如下的表头设计形式:
表头设计
A
B
C
列号
1
2
3
4
有了表头设计便可写出试验计划,只要将置因子的列中的数字换成因子的相应水平即可,不放因子的列(称为空白列)就不予考虑。
本例的试验计划可以这样的可以这样得到:
将第一列的1,2,3分别换成充磁量的三个水平900,1100,1300,将第二列的1,2,3分别换成定位角度的三个水平10,11,12,将第三列的1,2,3分别换成定子线圈匝数的三个水平70,80,90,测得试验计划(见表2.3-3)。
表中第一号试验的条件是充磁量取900×10-4特,定位角度取10度,定子线圈取70匝。
其他各号试验条件类似得到。
表2.3-3试验计划与试验结果
试验号
充磁量(10-4特)
定位角度(度)
定子线圈匝数(匝)
试验结果y
1
(1)
900
(1)
10
(1)
70
160
2
(1)
900
(2)
11
(2)
80
215
3
(1)
900
(3)
12
(3)
90
180
4
(2)
1100
(1)
10
(2)
80
168
5
(2)
1100
(2)
11
(3)
90
236
6
(2)
1100
(3)
12
(1)
70
190
7
(3)
1300
(1)
10
(3)
90
157
8
(3)
1300
(2)
11
(1)
70
205
9
(3)
1300
(3)
12
(2)
80
140
由此可见,用正交表L9(34)安排试验共有9个不同的试验条件,它们是一起设计好的,而不是等一个试验结束后再决定下一个试验条件,因此称这样的设计为“整体设计”。
这里9个试验点在三维空间中分布在一个长方体上,见图2.3-1,从图中可见:
从三个方向的任一方向做三个等距的垂直于坐标轴的平面,则在每一行上有一个点,每一列上也有一个点。
因此这9个点在三维空间的分布使均匀分散的。
(二)进行试验和记录试验结果
有了试验计划后就可以按其进行试验,并将试验结果记录在对应的试验条件后面,对于【例2.3-1】的问题,为计算和分析方便起见,表2.3-3中的y值是实测的104倍。
为了避免实现某些考虑不周而产生系统误差美因茨试验的次序最好要随机化,这可以用抽签的方式决定,譬如用9张同样的纸,分别写上1~9,经混乱后依次取出,如果依次摸到:
3,5,2,9,1,6,4,7,8,那么就先做第3号试验,再做第5号试验,……,最后做第8号试验。
此外,在试验中还应尽量避免因操作人员的不同,仪器设备的不同等引起的系统误差,尽可能使试验中除所考察的因子外的其他因素固定,再不能避免的场合可以增加一个“区组因子”。
譬如试验由三个人进行,则可以把“人”也看成一个因子,三个人便是三个水平,将其放在正交表的空白列上,那么该列的1,2,3对应的试验分别由第一、第二、第三个人去做,这样就避免了因人员变动所造成的系统误差。
(三)数据分析
在【例2.3-1】中考虑了三个三水平因子,其所有不同的试验条件共有27个,现在仅做了其中的9个。
试验的目的是想找出那些因子对指标是有明显影响的,各个因子的什么样的水平组合可以使指标达到最大。
这可以利用正交表的特点进行数据分析。
仍然结合【例2.3-1】进行叙述。
表2.3-4【例2.3-1】直观分析计算表
表头设计
A
B
C
y
列号
试验号
1
2
3
4
1
1
1
1
1
160
2
1
2
2
2
215
3
1
3
3
3
180
4
2
1
2
3
168
5
2
2
3
1
236
6
2
3
1
2
190
7
3
1
3
2
157
8
3
2
1
3
205
9
3
3
2
1
140
T1
555
485
555
T2
594
656
523
T3
502
510
573
1
185
161.7
185.0
2
198
218.7
174.3
3
167.3
170.0
191.0
R
30.7
57.0
16.7
1.数据的直观分析
(1)寻找最好的试验条件
首先我们来看第一列,该列中的1,2,3分别表示因子A的三个水平,按水平号将数据分为三组:
“1”对应{y1,y2,y3},“2”对应{y4,y5,y6},“3”对应{y7,y8,y9}。
“1”对应的三个试验都采用因子A的一水平进行试验,但因子B的三个水平各参加了一次试验,因子C的三个水平也各参加了一次试验。
这三个试验结果的和与平均值分别为:
同理可得T2=594,
2=198,T3=502,
3=167.3
由以上可知,
1,
2,
3之间的差异只反映了A的三个水平间的差异,因为这三组试验条件除了因子A的水平有差异外,因子B与C之间的条件是一致的,所以可以通过比较这三个平均值的大小看出因子A的水平的好坏。
从这三个数据可知因子A的二水平最好,因为其指标均值最大。
这种方法比较称为“综合比较”。
以上计算都列在表2.3-4的下方。
同理可看到第二列与第三列,按其中的1,2,3分别将数据分成三组,计算各自的数据和与平均,它们也都列在表2.3-4的下方。
由此可知,因子B取二水平较好,因子C取三水平较好。
综上可知使指标达到最大的条件是A2B2C3,即充磁量取1100×104特,定位角度取11度,定子线圈取90匝可以使输出力矩达到最大。
(2)各因子对指标影响程度大小的分析
这可从各个因子试验结果的极差来看,这里指的一个因子的极差是该因子不同水平对应的试验结果的均值的最大值与最小值的差,因为该值大的话,则改变这一因子的水平会对指标造成较大的变化,所以该因子对指标的影响大,反之,影响就小。
在本例中因子A的极差为:
RA=198-167.3=30.7
对因子B、C可同样计算,它们被置于表2.3-4的最下面一行。
从三个因子的极差可知因子B的影响最大,其次是因子A,而因子C的影响最小。
(3)各因子不同水平对指标的影响图
为直观起见,可以将每个因子不同水平下试验结果的均值画成一张图,【例2.3-1】的图见图2.3-2,从图上可以明显看出每一因子的最好水平A2,B2,C3,也可以看出各个因子对指标影响的大小,RB>RA>RC。
图2.3-2因子个水平对输出力矩的影响
2.数据的方差分析
在数据的直观分析中是通过极差的大小来评价各个因子对指标影响的大小,那么极差要小到什么程度可以认为该因子水平变化对指标值已经没有显著的差别了呢?
为了回答这一问题,需要对数据进行方差分析。
在方差分析中,我们假定每一试验是独立进行的,每一试验条件下的试验指标服从正态分布,这些分布的均值与试验条件有关,可能不等,但它们的方差是相等的。
(1)平方和分解
为进行方差分析,从试验结果出发。
由于试验条件的不同与试验中存在误差,因此各试验结果不同,我们可以用总(离差)平方和ST去描述数据的总波动:
(2.3-2)
其中n是试验次数,
是试验结果的总平均,若计
,则
=T/n。
造成数据波动的原因可能是因子所取的水平不同,也可能是试验误差,当然也可能两者都有。
为此要把由各个原因造成的波动分别用数量来表示。
先来看由于因子A的水平不同所引起的数据波动度量。
仍用
1、
2、
3表示其三个水平下的试验结果平均,用
表示试验结果的总平均。
我们考虑
1、
2、
3与
的(离差)平方和,计为SA:
(2.3-3)
这里乘以3是因为每一水平重复进行了三次试验。
SA除了误差外只反映因子A的水平间的差异,即由于因子A的水平不同所引起的试验结果的波动。
因此称其为因子A的(离差)平方和。
由于这里的
1、
2、
3是第一列的3个数字分别对应的试验结果的平均值,因此(2.3-3)式也可以看成是第1列的平方和,计为S1。
因为因子A置于第1列,故SA=S1。
同理可以计算其他各列的平方和。
由于因子B、C分别置于第2、3列,故有SB=S2,SC=S3。
第四列上没有置因子,称为空白列。
S4仅仅反映了由误差造成的数据波动,称它为误差平方和,计为Se,即:
Se=S4
用代数法可以证明,在L9(34)中总平方和与各列平方和间有如下关系:
ST=S1+S2+S3+S4
对于一般的正交表来讲,只要其行数n、列数p与水平数q满足(2.3-1)式,则有:
ST=S1+S2+…+Sp(2.3-4)
称(2.3-4)为平方和的分解式。
(2)F比
与方差分析类似,称(离差)平方和与自由度的比为均方与误差的均方进行比较,当F因=MS因/MSe>F1-ɑ(f因,fe)时,认为在显著性水平ɑ上因子是显著的,其中MS因,f因分别是因子的均方与自由度,MSe,fe分别是误差的均方与自由度。
为此需要给出因子与误差的自由度。
同方差分析中所述,一个因子的自由度是其水平数—1,在正交设计中因子是置于正交表的列上,为叙述方便,也成正交表一列的自由度为其水平数—1,即q—1,因子的自由度与所在列的自由度应该相等。
而误差平方和为正交表上空白列的平方和相加而得,其自由度为正交表上空白列的自由度相加。
总平方和的自由度是试验次数—1。
当正交表中行数n、列数p与水平数q满足(2.3-1)式时,对平方和有关系式(2.3-4),同样,对自由度也有相应关系式:
fT=f1+f2+…+fp
这里fT=n—1,也成它为正交表的自由度。
(3)计算
通常也用列表的方法计算各列平方和(见表2.3-5)。
通过代数运算,可以用下式计算一列平方和与总平方和:
,
(2.3-5)
表2.3-5【例2.3-1】的方差分析计算表
表头设计
A
B
C
y
列号
试验号
1
2
3
4
1
1
1
1
1
160
2
1
2
2
2
215
3
1
3
3
3
180
4
2
1
2
3
168
5
2
2
3
1
236
6
2
3
1
2
190
7
3
1
3
2
157
8
3
2
1
3
205
9
3
3
2
1
140
T1
555
485
555
536
T=1651
=310519
ST=7652.2
T2
594
656
523
562
T3
502
510
573
553
S
1421.6
5686.9
427.6
116.2
利用(2.3-4)式可以验证平方和计算是否正确。
对于F比的计算通常列成一张方差分析表(见表2.3-6)。
表2.3-6【例2.3-1】的方差分析表
来源
平方和
自由度
均方
F比
因子A
1421.6
2
710.8
12.23
因子B
5686.9
2
2843.4
48.94
因子C
427.6
2
213.8
3.68
误差e
116.2
2
58.1
总计
7652.2
8
F0.90(2,2)=9.0,F0.95(2,2)=19.0
由于FA大于F0.90(2,2)=9.0,FB大于F0.95(2,2)=19.0,因此因子A与B分别在显著性水平0.10与0.05上是显著的,而因子C不显著。
(4)最佳条件的选择
对显著因子应该选择其最好的水平,因为其水平变化会造成指标的显著不同,而对不显著因子可以任意选择水平,实际中常可根据降低成本、操作方便等来考虑其水平的选择。
在【例2.3-1】中因子A与B是显著的,所以要选择其最好的水平,按前所述,应取A2B2;对因子C可以选择任意水平,譬如为了节约材料可选C1。
将此最佳条件计为A2B2或A2B2C,由于C不显著,故可不写,若写的话,无下标,表示可根据节省时间、节约消耗等实际情况取三个水平中的某一个。
3.因子的贡献率分析
当试验指标不服从正态分布时,进行方差分析的依据就不够充足,此时可以通过比较各因子的“贡献率”来衡量因子作用的大小。
由于S因中除了因子的效应外,还包含误差,从而称S因—f因MSe为因子的纯(离差)平方和,称因子的纯平方和与ST的比为因子的贡献率。
而称fTMSe/ST为误差的贡献率。
在【例2.3-1】中因子与误差的贡献率如表2.3-7所示。
表2.3-7【例2.3-1】因子与误差的贡献率
来源
平方和
自由度
纯平方和
贡献率(100%)
因子A
1421.6
2
1305.4
17.06
因子B
5686.9
2
5570.7
72.80
因子C
427.6
2
311.4
4.07
误差e
116.2
2
464.8
6.07
总计
7652.2
8
从表中可知,因子B最重要,它的水平变化引起的数据波动在总平方和中占了72.80%,其次是因子A,而因子C的水平变化引起的数据波动还不及误差引起的数据波动的贡献率大,所以因子C可以认为不重要。
(四)验证试验
在【例2.3-1】中找到的最佳条件是A2B2,即试验中的第5号试验,其试验结果确为9次试验中指标最高的。
但在实际问题中分析所得的最佳条件不一定在试验中出现,为此通常需要进行验证试验,譬如选择条件A2B2C1,该条件就不在所进行的9次试验中,它是否真的符合要求?
所以在实际中验证试验是不可少的,即使分析所得的最佳条件在试验中出现,也需要通过验证试验看起是否稳定。
例如在【例2.3-1】中对条件A2B2C1进行了三次试验,结果分别为233,240,220,其平均值231看来该条件是满意的。