一次回归正交设计.docx

资源描述

一次回归正交设计.docx

《一次回归正交设计.docx》由会员分享，可在线阅读，更多相关《一次回归正交设计.docx（12页珍藏版）》请在冰点文库上搜索。

一次回归正交设计.docx

一次回归正交设计

第五讲　回归设计及统计分析

设目标性状y与z1、z2……zm等因素有关，我们可以应用回归分析的方法建立y与诸因素的回归方程，以此对y进行预测和控制，或筛选y的最优指标。

z1、z2……zm构成一个因子空间，每一组z1、z2……zm值对应一个y值。

如何在因子空间中选择最适当的试验点，以最少的试验点寻求y的最优区域，这就要将回归分析与正交设计结合起来应用，称为回归正交设计。

按回归模型的次数，回归正交设计又分为一次回归正交设计和二次回归正交设计。

一、一次回归正交设计

一次回归正交设计主要是应用2水平正交表进行设计，其设计和分析步骤如下。

1．确定试验因素的变化范围

例如研究m个栽培因素z1、z2……zm与作物产量y的数量关系，首先需确定各个栽培因素的变化范围。

设因素zj的变化区间为（z1j，z2j），则z1j和z2j分别为因素zj的下水平和上水平。

那么

为因素zj的零水平。

为因素zj的变化区间。

2.对各因素的水平编码

编码就是对各个因素的取值作如下线性变换：

式中xj为编码值。

如：

这样就建立了zj与xj的一一对应关系：

下水平　　z1jx1j（-1）

零水平　　z0jx0j（0）

上水平　　z0jx0j（+1）

通过上面的编码可知，当zj在区间（z1j，z2j）变化时，它的编码值xj就在区间（-1，+1）内变化。

多个因素的编码工作可在因素水平编码表（表1）上进行。

表1因素水平编码表

因素

……

下水平

Z11

Z12

……

Z1m

零水平

Z01

Z02

……

Z0m

上水平

Z21

Z22

……

Z2m

变化间距△j

△1

△2

……

△m

对因素的水平进行编码后，y对z1、z2……zm的回归问题就转化为对x1、x2……xm的回归问题。

在z1、z2……zm因子空间选择试验点的问题就转化为x1、x2……xm为坐标轴的编码空间选择试验点。

在二次回归设计中也要进行因素的编码工作。

3.选择合适的二水平正交表

常用的二水平正交表有L4（23）、L8（27）、L12（211）、L16（215）等。

选用哪一种二水平正交表要依据因素个数及需要研究的交互作用而定。

正交表确定以后，把表中的“2”改为“-1”。

这样正交表中的“+1”“-1”既表示因素的不同水平，也表示xj的取值。

表2列举了经代换后的几张常用二水平正交表。

表2常用二水平正交表L4（23）

试验号

-1

L8（27）

试验号

x1x2

x1x3

x2x3

x1x2x3

-1

L12（211）

试验号

x10

x11

-1

如设计一个3因素试验，可选用L8（27）正交表，表中x1、x2、x3分别代表z1、z2、z3的编码值。

若因素间有互作存在，在回归中可用非线性项x1x2、x1x3、x2x3等表示。

每种交互作用占改造后二水平正交表的1列，该列的取值可由某两列上元素对应相乘得到。

如表2　L8（27）中x1x2列的元素是由x1与x2列上的对应元素相乘而得。

用二水平正交表设计的这种试验具有正交性。

若以

表示在第

试验中第j个变量的编码值，于是在试验计划中有

任一列的和

任两列的内积

具有以上两个性质的设计为正交设计。

4.建立回归方程

对于3因素试验，若考虑因素间的交互作用，则回归方程为

例如用L8（27）正交表设计该试验，那么它的结构矩阵为

信息矩阵（系数矩阵）为

相关矩阵为

常数项矩阵为

为试验结果，于是可算出回归系数矩阵

那么各类回归系数即由下式算出

回归系数的具体计算可在正交表上进行（表3）.表中bj为各回归系数，Qj为偏回归平方和。

从而建立回归方程。

表33因素一次回归正交设计计算表

试验号

x1x2

x1x3

x2x3

试验结果

-1

B0/8

B1/8

B2/8

B3/8

B12/8

B13/8

B23/8

从以上计算可看出，各变量的偏回归平方和

，与偏回归系数bj的平方成正比。

bj的绝对值越大，Qj也越大。

这就意味着，在利用正交表所得到的回归方程中，每一个回归系数bj的绝对值大小，反映了对应变量xj对y作用的大小。

这是因为经过无量纲编码后，所以变量的取值都是1和-1，它们在所研究的区域内取值是平等的，且不受单位的影响，因此所求回归系数bj直接反映了因素zj作用的大小，回归系数的符号反映因素作用的性质。

在要求不太高的情况下，一次回归正交设计可省略方差分析，直接把回归系数与零相差不大的因素从回归方程中剔除，不需重新计算其它回归系数，剔除因素对结果的影响可并入试验误差。

但对精度要求较高的试验，应继续进行回归关系的显著性测验。

5.回归方程及回归系数的显著性测验

一次回归正交设计的方差分析如表4。

表4一次回归正交设计的方差分析表

变异来源

自由度

平方和

均方

F值

回归

离回归

总

x1x2

xm-1xm

对回归方程的显著性假设测验可通过表4中的F测验进行。

但这种测验只是说明m个变量对试验结果的影响是显著的，而在研究区域内回归方程与实测值的拟合情况，即采用一次回归模型是不是最合适，从以上测验中没有得到这方面的信息。

为了了解回归方程的拟合情况，需在零水平（

）安排一些重复试验，如在安排p次重复试验所得试验结果为

，其平均数为

，则

由此可用t测验对回归方程中的拟合情况进行测验：

若求得

，则认为b0与

无显著差异，一次回归方程与实测值拟合得较好。

反之，就认为用一次回归来描述问题不够确切，可考虑建立高次方程。

拟合度测验也可通过F测验进行：

若F1

一般先进行拟合测验，在方程拟合情况较好的情况下，再进行回归方程的显著性测验。

故将拟合度测验的F值记作F1，而回归显著性测验的F值记作F2。

回归系数的显著性测验可由表4的F测验进行，也可通过t检验给出。

服从

的t分布。

<例>研究氮、磷、钾施用量对大豆籽粒产量的影响，试作一次回归正交设计，并对试验结果进行分析。

1.确定各试验因素水平并进行编码

首先各因素的上、下水平，将3个因素的变化范围分别定在（2,6）、（3,9）、（3,9），单位为斤/亩。

然后计算各因素的零水平和变化间距，列出因素水平编码表（表5）。

表5　　因素水平编码表

因素

变化间距

水平编码

-1

z1氮（尿素）

2斤/亩

z2磷（三料磷）

3斤/亩

z3钾（硫酸钾）

3斤/亩

2.制定实施方案　　　

选择L8（27）正交表，实施方案如表6。

表6氮、磷、钾肥料三因素试验实施方案

试验号

试验设计矩阵实施方案

尿素

（斤/亩）

三料磷

（斤/亩）

硫酸钾

（斤/亩）

-1

为对回归方程进行拟合度检验，增设4个零水平试验。

经实施后，试验结果及结构矩阵列于表7。

为计算常数项b0，在试验结构矩阵中添上x0列，取值皆为1。

表7试验结构及数据分析

试验号

x1x2

x1x3

x2x3

y（公斤/亩）

155.3

-1

180.7

-1

180.7

-1

178.3

-1

121.7

-1

153.6

-1

112.0

-1

116.1

158.3

163.3

166.0

150.8

1836.8

191.6

24.2

-59.0

-70.2

-55.6

153.1

23.95

3.025

-7.375

-8.775

1.625

-6.95

4588.82

73.205

435.125

616.005

21.125

386.42

3.计算回归系数，建立回归方程

产量结果列在表7的最后一列。

计算可在表7上进行。

各项数值的计算过程如下：

……

由以上计算得如下回归方程：

4.回归方程的假设测验

先计算各项平方和与自由度

首先对回归方程的拟合度进行测验，可用F测验和t测验两种方法。

（1）F测验

（2）t测验

以上两种测验都说明建立的回归方程与实际情况吻合较好，可以用一元回归描述。

进一步测验回归方程的显著性，在方差分析表（表8）中进行，测验表明所得回归方程达0.01极显著水平。

表8　　方差分析

变异来源

自由度

平方和

均方

F值

Fo.o1

回归

6120.7

1020.12

13.08

10.67

离回归

389.89

77.98

总

6510.59

回归系数的显著性测验

（1）t测验

计算各回归系数的t值如下:

查表得

（2）F测验

查表得

与t测验结果相同。

将不显著的变量x2和x1x3从回归方程中剔除，则回归方程为

作业：

有一3因素一次回归正交设计试验，其试验结构矩阵及结果列于下表，试建立回归方程。

试验号

2.94

-1

3.48

-1

3.49

-1

3.95

-1

3.40

-1

4.09

-1

3.81

-1

4.79

4.17

4.09

4.38

[答案：

]

展开阅读全文