混料均匀试验设计.docx
《混料均匀试验设计.docx》由会员分享,可在线阅读,更多相关《混料均匀试验设计.docx(101页珍藏版)》请在冰点文库上搜索。
![混料均匀试验设计.docx](https://file1.bingdoc.com/fileroot1/2023-6/13/d4edb622-880f-4f12-a073-b7197f24c5f0/d4edb622-880f-4f12-a073-b7197f24c5f01.gif)
混料均匀试验设计
华中师范大学
博士学位论文
混料均匀试验设计姓名:
宁建辉
申请学位级别:
博士专业:
统计学
指导教师:
谢民育;方开泰
20080501
⑨博士擘住论文
DOCro叹AIDIsSE船【:
^n0N
中文摘要
在化工、材料工业、食品及低温超导等领域中的一些试验中,试验考察并不是各影响因素不同水平组合对响应的影响或它们间的相互关系。
而是要考察各因素在所有因素混料中所占比例对响应的影响。
这种与一般因子试验的区别使得混料设计(或称配方设计)不论是理论还是应用上都非常重要。
混料均匀设计以在混料试验区域均匀布点为出发点,提供了一种模型稳健的设计方案。
克服了最优设计在区域边界布点过多及过于依赖模型假设条件的弱点。
丰富了试验设计理论。
本文结合均匀设计的思想,提出了混料设计试验区域(区域为标准单纯形)上的L2一偏差“DMj偏差”及“CDMj偏差”。
并推导出了它们的一般计算公式。
为均匀混料设计优良性提供了一个方便可行的度量标准。
在这两个偏差准则下,对于同一个试验问题的两个不同设计,可以通过计算它们的偏差值方便的选出较均匀的设计。
从而为实际实验选出较合理的设计方案。
在现有的设计表构造方法的基础上,本文提出了几种新的设计表构造方法。
对于一般的无限制条件混料设计,提出了U型设计变换法及非边界单纯形格子搜索法。
在试验维数不高,而试验点数n也不大时,这两种方法都有不错的效果。
而对于有限制条件混料设计中的保序限制条件混料设计,本文证明了在次序变换下,变量的分布仍保持原来的均匀分布。
因此,为保序限制条件混料设计找到了简单可行的设计表构造方法。
最后,考虑到混料均匀设计和一般因子设计中的均匀设计一样:
“维数较高的时候,设计表构造的计算是个NP.hard问题”。
本文引入了门限接受和Nn,BG两种算法,在减小设计表构造中计算量的同时,找到较均匀的设计。
并对Nn屉G算法做出了该进,克服了N兀BG算法仅对MSE偏差收敛的弱点。
提出了加权NnBG算法,在’D%偏差下也能找到较均匀的混料设计。
关键词:
试验设计;混料设计;均匀设计;混料均匀设计;偏差;门限接收法;
Nr兀BG算法:
肝net
⑨博士学位论文
DOcToRALDISSERT加1aN
Abstract
‰gaIldW抽g(1990)devisedme‘umfo肋designfor111ix眦expe血e心’toover-comesomeoflimitationsof吐leopciInaldes远nthatbccome印parcntincenainsituations.Theirmethod仃aIlsfo册edtheuIlifo册designoffactorialexperiInentsint0t11emixturedesign.Thisapproachhasmanybene疗tsandisoftensuf6cient;howeVer'thenonlin—ear咖sfo册ationc姗otm血taill山eu删.o珊【i哆111emixn船designacllievedby吐leirme吐lodmaynotbet11ebestone.
Intllismesis,Ifindacriteriontoconstmcttheunif0珊designforexperimentswithmixture.Specjfically,IproposethediscrepancyDMjaJldGDMjasanewmethodt0measure吐leuIlif锄哆ofmixtllredesign.ThecoInlmtationaJfo肋ulaof山ediscrepancy’by小efhnctjonalmemod,wasalsodetennined.Thesuperiordesigni11aIly哪om诬t11redesignswaLsdemonStratedcoIⅣenientlybycompa血lgtheValuesofDM.2andCD^如.
This山esisadVancestwoapproachestoconsmlct山euIlifbnndesignfbrunconstraillc通rnixtu】汜experirnents.Oneis山e‘‘Transfo】衄ofU一哆peMatrix”,aJld山esecondisthe“Searchi11血嘶0rofS曲plex—laⅡice”.Bo山achieveda900ddesigIlwbentben1如berofingredientsaJlddesignpointsweresmall.Foraspecific妙peofconstrajnedrIlixtureex-pe血ent,i.e.isot01licres啊ctionm政tureexp咖ent,Id锄onS廿ateⅡ1atmeV面ablessdUfollowaunjfo】衄dis伍bu【ionmerbe遗gordered.Hence,aun讧b衄designisachieVedfor吐leisotoIlicrestrictionⅡ1ixtureeXpe血entifau1删日衄designfbruncons岫edInixtllreexperimente贴sts.
Last,血istllesisapplies山e‘11lresholdAcc印血培’aJld‘NTI层Ga】gori山m’t0con-s廿uct山elllⅢ.0mdesignfbrexpe曲enta】design、析山mixtIlre.ThereSultSshowedtllatt11ealg商dlma出evedagooddesign确珂t11ec0InplicateofcomputadonwaSroduced.Fu【mIer't11ewei曲ted卜ⅢBGalg嘣血n,wllichwasadV纽cedbaLsedon山eN兀卫Galgo—ri吐1ln'acKeveda900ddesignunder也eD朋_2谢t嘶onbutnotllndertheMSE瓯t缸on,i.e.山eNTIBGalgoritIml.
Inconclusion’thisnewmethoddevelopsthe出eoryof吐lell玎商。
衄expe血entalde—sign谢t11m政tu】汜,andcaIlhelptoadVanceitsu血tyinacade血aandi11duS时KeywordS:
un曲衄design;expe血ent丽thm奴tllI℃;lln怕珊designforIni叉ture
experirnent;discrep锄cy;thresholdacc印曲g;卜mBGalg嘶t11m;NT-net
⑨博士学位论文
DOCTORALDISSERTATION
华中师范大学学位论文原创性声明和使用授权说明
原创性声明
本人郑重声明:
所呈交的学位论文,是本人在导师指导下,独立进行研究工作所取得的研究成果。
除文中已经标明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的研究成果。
对本文的研究做出贡献的个人和集体,均已在文中以明确方式标明。
本声明的法律结果由本人承担。
作者签名:
日期:
厮f月印日
学位论文版权使用授权书
本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:
学校有权保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。
本人授权华中师范大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。
同时授权中国科学技术信息研究所将本学位论文收录到《中国学位论文全文数据库》,并通过网络向社会公众提供信息服务。
作者签名:
导师签名:
∥刁q乞火la日期:
川年厂月z/日导师签名:
≥即嘶日期:
≯口忍』踔I,月z加本人已经认真阅读“CALIS高校学位论文全文数据库发布章程”,同意将本人的学位论文提交“CAL工S高校学位论文全文数据库"中全文发布,并可按“章程”中的规定享受相关权益。
回童途塞握变压澄后i旦圭生;旦二生;旦三生蕉查!
作者签名:
日期:
Ⅵ召年r月V7日劾,略抑始≯和翰日期:
y扩年r月’胡
⑨博士学位论文
DC研oRAIDISSERI:
A110N
第一章背景与引言
§1.1试验设计
我们的日常生活中到处都有试验的身影,小到家庭主妇日常的食品制作,大到如材料科学、半导体、超导体、生命科学以及人工智能等现代科学行业中的技术创新都离不开试验设计。
通过试验和后续的数据分析,试验者可以挖掘出一个工艺过程中,输入因素是如何影响输出的。
甚至于建立起输入输出的数学关系模型。
从而有效地指导实际的工艺生产过程。
如何科学、合理地安排试验,使得试验者在尽可能少的实验消耗下,得到大量的信息,为后续的数据分析提供尽可能多的信息,以致事半功倍的效果就成为试验者努力追求的目标。
如何科学的组织试验,包括很多环节:
选题、精心挑选试验因素及其变化范围,以及决定因素的水平和处理组合,试验中的技术细节和组织工作等等。
这些环节,有的是属于管理科学,有的是需要数学和统计学的方法来设计试验方案,这就是所谓的统计试验设计。
由于本文讨论内容仅限于统计试验设计范畴,在后文的叙述中只简单的说试验设计,而略去统计两个字。
早在20世纪初,Rona】dA.Fisher爵士在他英国的农业试验站数据收集和分析中系统的应用了统计方法,在试验设计和统计分析方面做出了一系列开创性先驱工作,奠定了现代试验设计的基石。
试验设计逐渐发展为统计科学的一个重要分支。
一个好的试验设计能大量节省试验次数能将试验数据从随机误差的烟雾中去伪存真,抓住事物的规律。
当然针对不同的试验目的,试验现状,必需选用不同的设计方法和原则。
才能充分的发挥试验设计的高效率,否则只能事倍功半。
下面简单的对几种较流行的设计做简单的介绍:
最优设计即是在已知真实模型的结构形式而只有有限的参数未知时,选用设计的准则。
在最优准则下选取的设计将会使得在后续建模中对参数的估计的达到最优。
例如:
例1假设某试验前已知,输出和输入的客观真实关系为(或可近似为)简单回归模型
y=,T(z)p+E=扁+岛z+E,E一Ⅳ(o,盯2).
因子区域为一l≤z≤10考虑三次试验,设计点分别为z1,z2,z3。
则由回归分析最小二乘估计理论得到估计及其方差
p=(FTF)一1y;
yor(卢)=盯2(FTF)一1.
⑨
预测值及其方差博士学位论文Do(汀DRALDlSSEEM0咐
多=厂(z)p,
ynr(雪)=盯2'厂T@)(FTF)-1.厂扛),
其中矿=(三:
:
:
。
)。
因此,可以说估计的好坏和信息矩阵FTF,也即设计点z1,z2,z3的取值有密切联系。
显然我们希望选择的信息矩阵上矽F越大越好。
正是基于这一思想J.1(iefer于1959年提出了最优设计。
针对矩阵不同的比较方式产生了:
a)D一最优设计:
取合适的试验点使得lFrFI达到最大。
b)A一最优设计:
取合适的试验点使得打((FTF)一1)达到最小。
c)E一最优设计:
取合适的试验点使得(∥rF)一1的最大特征根最小。
d)G-最优设计:
取合适的试验点使得响应预报值的最大方差最小。
在模型已知的情形下,最优设计不失为一种非常好的设计,但它也有明显的缺点:
a)在很多复杂模型下,目前的理论还不能得到显性的设计。
b)不具有稳健性,如前所述最优设计准则是建立在模型结构已知的前提下最优没的,一旦此前提假设出现偏差,则设计可能就成为较差的设计。
正交试验设计是用于多因素试验的一种试验设计方法,它是从全面试验中挑选出部分有代表的点进行试验,这些点具有“均匀”和“均衡”的特点。
正交试验设计是部分因子设计的主要方法。
设在一项研究中考察s个因素,根据实际的需求分别取了91,…,吼个水平,则全部的水平组合总共有Ⅳ=口1…gs个。
当s及91…gs都不是很大时,有可能对所有Ⅳ个水平组合都作同样次数的试验,这种试验方法称为全面试验。
可是当全部水平组合数Ⅳ太大时,可从中Ⅳ个水平组合中抽取部分有代表性的水平组合来做试验,这种方法称为部分因子设计。
正交设计提供了一种选择的原则:
a)任一因素的诸水平做相同数目的试验;
b)任两因素的水平组合做相同数目的试验。
例2(摘自方开泰、马长兴(2001)例2.1)为了提高某化工产品的转化率,试验者选择了3个有关的影响因素:
反应湿度(A),反应时间(B),用碱量(C),并选择如下的试验范围:
A:
80。
~90。
,B:
90分~150分,C:
5%一7%。
若对每个因素取3个水平:
2
⑨
博士擘住论文
DCCTORALD塔SEKMaN
表1.1:
正交表L9(34)
No123456789
l111222333
2123123123
31232313l
2
4123312231
A:
800,85。
,900:
B:
90分,120分,150分;C:
5%,6%,7%。
对这一问题若采用全面试验,则至少要进行33=27次试验。
全面试验可以将因素和响应之间的关系分析较彻底,但全面试验的试验次数太多,特别是当试验的因素或因素的水平较多时。
采用正交试验则可以有效的减少试验次数。
本例若采用正交设计方法指导试验,则可以减少
许多试验次数。
可以采用正交表L9(34)(见表1.1)前三列对应的因素水平组合进行试验,只需
9次试验。
表1.1中的1,2,3只是代号,代表因素的水平。
如第一、二、三列分别对应因素A、B及C。
则表第一行表示一次试验,各试验因素水平分别为80。
、90分及5%。
如此类推可得到9次试验的实际水平组合。
9次试验的顺序随机决定。
许多文献在理论上证明了,正交设计具有很好的统计性质。
如:
Cheng(1980)在方差分析模型下证明了正交设计是一致最优的。
Chen,F抽g柚dWiIll(e“1998)给出了:
任一正交设计一定是某个多项式回归模型的D一最优设计。
、
均匀试验设计是一种空间填充(Spacefilling)设计,对于试验的真实模型假设较少,因此均匀试验设计是一种稳健设计。
上文提到的正交设计和最优设计有一个共同的特点,就是假设潜
3
⑨博士学位论文
DocToRALDlSSERT棚oN
在的真实模型结构是己知的,只有模型的参数未知。
针对试验的特殊模型结构找到对未知参数估计高效的设计。
正是这种对模型的针对性使得设计在稳健型方面较差。
而事实上,很多试验在实验前并没有足够的信息对潜在的真实模型结构作假设。
因此,在很多情况下,我们需要更为稳健的设计。
F:
mg(1980)和RmgaIldⅥbg(1981)提出的均匀设计正是这样‘一种设计。
设一个试验中5个因素,它们各自取了口个水平。
若用正交试验法来安排这一试验,欲估计某因素的主效应,在方差分析模型中占g一1个自由度,s个因素共有s(g一1)个自由度。
如果进一步考虑任两个因素的交互作用,共有(:
)个这样的交互作用,每个占(g一1)2个自由度。
上述两项自由度之和为s(口一1)+;s(s一1)(g一1)2。
通常我们可以忽略更高阶的交互效应,因此试验数n必须大于s(g一1)+;s(s一1)(g一1)2。
例如,在一个5因素三水平的试验中,试验数几必须大于50。
在多数试验中上述的主效应和二因素间的交互可能不同时显著,若试验前己有足够的证据可忽略某些主效应或交互效应,则n可适当减少。
只是,在许多试验中,试验前试验者并不清楚各效应的相对重要程度。
在正交设计方案下,试验者只有选择做50次以上试验。
于是,在文献中强烈推荐使用二水平试验,这时s(g一1)+;s(s一1)(g一1)2=s+;s(s—1),当s增加时,其试验次数增加的速度为s2阶,对大多数试验可以接受。
众所周知二水平试验只能揭示响应和因素间的线性关系,三水平试验只能拟合响应和因素间的二次多项式关系。
当响应和因素间的关系为高次多项式或非线性关系时,就需要更高水平的试验。
这时方差分析模型要求的试验次数会使试验者望而止步。
用回归模型代替方差分析模型可能是解决上述困难的方法之一。
用z1,…,轧代表试验中的s个因素,则巧,z;,z;分别表示因素z,的一阶,二阶,三阶主效应,既z,表示因素盈和巧的二阶交互效应,。
;巧和盈z;表示它们的三阶交互效应,盈z;,z;z;和zi巧表示它们的四阶交互效应,等等。
这时,二次模型
y=岛+。
∑汹屈以+。
∑甜。
∑芦晟.谕巧十
中有2+s+s(s+1)/2个未知参数,其中包括误差方差仃2=yor(E)。
当s=5时,上式中有22个未知参数,若试验数n>22,则上述参数均可以估计,比方差分析模型要求的试验礼>50的条件要低很多。
若采用回归分析中的变量筛选技术,则试验数还可以进一步减少。
众所周知,最优设计是建立在回归模型基础上,特别当回归模型为(1.1)时,最优设计是已知的效率最高的设计。
但,若潜在的真实模型并不是(1.1),例如,模型中含有更高阶的交互作用项盈z;,z;巧,z;z;甚至于有非线性项时,寻求相应的最优设计必须使用相关的电脑软件,很多4
⑨博士学住论文DcC卫D1砒DIsSElnAnON
时候得到的解并不是真正的最优设计。
更严重的是,试验者并不知道真正的模型是什么,这时就无法采用最优设计了。
而均匀设计正好是这样一种对模型的变化有一定的稳健性。
综上所述,均匀设计引入了非参数或半参数回归模型,从而避免了方差分析模型(正交设计的基础)中效应多且复杂的缺点。
大大的减少了试验必需的次数。
不失一般性设z1,z2,…,钆的试验区域为C8=【o,1】5,
可=夕(z1,z2,…,z。
)+e,(1.2)
式中9属于某个已知函数类(例如二次可微,可积),但未知。
试验者希望通过试验,找到函数9的近似表达式。
数学意义上,试验设计即是要在试验区域C5挑选n(试验次数)个点z1,z2,…,z。
进行试验,从而收集到影响因素对试验响应影响方式及影响力度的信息。
但到底n个试验点分别取在什么位置,或以什么方式,准则确定死个试验点的具体位置,坐标。
在缺少潜在真实模型信息的情况下,均匀设计认为试验区域的任一点所包含的信息量无差别,也就是认为试验点应尽可能均匀的散布在试验区域中。
因此,均匀设计判断设计是否优良的基本原则为“试验点在试验区域散布越均匀的设计越优良”。
有了基本的原则,接下来就是如何量化和执行的问题了。
如何来比较设计间的均匀性,首先要解决的问题就是如何来量化和刻画一个设计的均匀性。
例如:
区域C5中的任意一个点集R=(zl,…,z。
)n×。
,它的均匀性如何?
能不能从数学上给出一个定量的刻画。
星偏差(starDiscrepaIlcy)是度量点集7■在区域C8上分布均匀的测度(详见Hua衄dWang(1981))。
HickemeU(1998a)和HickemeU(1998b)改进了通常的L2-偏差(W.eyl(1916)提出),提出了中心化L2-偏差和可卷L2-偏差。
之后,}王ick锄eU
好性质。
andL.u(2002)又提出了离散偏差。
较好地度量了设计的均匀性。
特别是其中的中心化工2一偏差具有许多统计上,应用上以及计算上的
以上述偏差为目标函数,寻找最优的均匀设计,就是个优化问题。
到目前已经有了许多的方法。
大多数方法都是建立在一种称为U一矩阵设计的基础上。
如:
好格子点法(W抽g
FaJlg(1981),RmgandaIldW抽g(1994)和方开泰和马长兴(2001)),拉丁方法(FAng,Shui锄dP锄(1999)),正交设计扩展法唧培(1995))以及随机优化方法,包括淬火算法,遗传算法,门限接受法等。
另外,均匀设计的应用也非常简单易行。
实际工作者只需根据自己的试验需求,‘找到相应的均匀设计表,根据设计表容易给出试验方案。
有两种方法可以找到所需的均匀设计表:
1)从一些现有的均匀设计表库里面下载,如均匀设计协会网页。
2)通过某些商业软件搜索。
5
⑧\=:
:
:
:
:
/博士学位论文DDCTrJRALDISSERl-^:
nON
均匀设计从提出到现在,不仅在理论上越来越完善,实际的应用中也日益广泛。
在航天、制药、石油、化工、自然科学研究、抽样调查、高科技产品和军工产品的研制等许多领域发挥着重要作用。
值得一提的是美国福特汽车公司己将均匀设计法作为他们新引擎的研究常规方法之一。
§1.2混料均匀试验设计
通常我们考虑的试验都可以将试验的试验区域抽象到立方体C8区域内,或可以通过简单的变换转化到立方体C8内。
也就是说试验时,各影响因素所取的试验水平相互间是独立的,一个因素的试验水平不受其它因素的试验水平影响。
可是现实中却不常常这样。
特别是工业、食品等行业。
许多产品都是由若干种配料混合而成的。
例如:
各种合金钢材都是以铁为基础再加适量的镊、铬、锰、碳等成分组成;氖灯灯泡巾包含有氦、氖、氩、氤等多种惰性气体;通常饮用的饮料则可能含有多种果汁及糖份和水:
药品、酒类产品则更复杂,含有更多种类的物质。
在这些产品中,各种配料的比例(proponions),配比或比率,常常是其产品品质的保证,也是厂家的重要技术机密。
如何选择各种配料在总混料中所占的比例,使得产品质量最佳,也是个生产厂家技术人员的核心目标。
寻找最佳配料比离不开试验。
但,这类产品的试验与一般的试验显然有很大的区别。
我们知道一般的试验,各试验的影响因素的试验区域之间是独立的,或可近似看作独立的。
但在上述配料试验当中,显然这种假设不成立。
因为各种配料所占的比例总是大于等于0,且总和一定等于1。
统计学家们针对这类实际问题提出了所谓的混料试验设计(desigrlofexpe曲entswimm奴ture)。
定义1.2.1(摘自Comell(1990)一书1.3节)我们称这样一类试验为混料试验,该类型试验的响应依赖于各试验因素在混料总量中所占的相对比例值,而不是各因素的实际水平值。
混料试验中,各成份(iIlgredient)或配料之间受非负和总和为1的条件约束,因此混料设计大大难于一般的s个因素之间无约束因子设计。
为次,文献中发展了许多方法来进行混料试验设计。
Schef伦(1958)首先提出了单纯形-格子点设计(Sirnplex.Lattice),奠定了混料设计的基础。
之后Sche舱(1963)针对单纯形-格子点设计在建模上的缺点,提出了单纯形-中心设计(SiInplex-centroid)。
单纯形一格子点设计和单纯形二中心设计的试验点多数位于单纯形因素空间的边界上。
而在现实的试验中通常我们往往需要的是完全混料试验,即每个成份的比例需大于O。
ComeUandGood(1970)和ComeⅡ(1975)提出了Cox设计和轴设计。
6
⑨博士擘住论文
DCC’rcIRALDIsSHnAnoN
上述设计都是从直观和最优设计的角度提出的,有缺乏模型稳健和边界布点过多的缺点。
为克服这两个缺点Wang弛dRLIlg(1990)将均匀设计的思想引入到混料设计中,提出了混料均匀设计。
其思想是将死个试验点m中不同的配方)均匀的散布在混料设计区域一单纯形上。
与一般的均匀设计最大的不同是,混料均匀设计的影响因素的取值区域不再是超级立方体,而是单纯形或其子集。
由于均匀设计在实际应用和理论研究上的日益重要性,混料均匀设计,甚至于不规则区域上的空间填充设计,也日渐引起统计学家和实际工作者的重视。
自WangandRmg(1990)提出了通过特殊变换超级立方体中的均匀性较好的设计得到混料均匀设计方法后,许多文献推广发展了这一方法。
如:
WrangandRmg(1996),FangandW钿g(1994),rnajla11d‰g(1999),陆gandY抽g(2000)andTi趾(1998)。
在这些文献中,他们提出了一些准则来度量试验点在混料设计区域内的均匀性。
遗憾的是这些准则基本上是原超立方体C5上均匀测度的变换,而由于变换的非线性性,有时给出的度量不尽合理,得到的设计也不一定是最佳的。
因此能否直接在混料设计区域(后文描述可知该区域为标准单纯形)定义一个均匀性测度,这是本文要解决的关键问题之一。
为混料均匀设计定义出方便、合理的均匀测度及在这些测度下构造