材料科学中的试验设计与分析 教学课件 作者 张忠明 第5章 回归分析与相关分析PPT格式课件下载.pptx
《材料科学中的试验设计与分析 教学课件 作者 张忠明 第5章 回归分析与相关分析PPT格式课件下载.pptx》由会员分享,可在线阅读,更多相关《材料科学中的试验设计与分析 教学课件 作者 张忠明 第5章 回归分析与相关分析PPT格式课件下载.pptx(76页珍藏版)》请在冰点文库上搜索。
另一个是随机性变量。
8,6/17/2019,试验设计与数据处理(ExperimentDesign&
DataProcessing),第5章回归分析与相关分析,三、回归分析所研究的主要内容,1、特定变量间是否存在相关关系?
找出变量间的定量关系式;
2、对所建立的关系式的可信程度进行统计检验。
3、判断哪些自变量的影响显著,哪些影响不显著。
4、利用所建立的经验公式,制定合理的生产工艺参数和产品的配方。
5、利用所求得的关系式和误差估计,进行生产中的预报和控制。
DataProcessing),第5章回归分析与相关分析,四、回归分析的基本思路,例1:
在研究管内液体传热问题时,根据因次分析,可设其“准数”数学模型为:
分析:
将上式等号两边取对数,并令,9,6/17/2019,试验设计与数据处理(ExperimentDesign&
DataProcessing),第5章回归分析与相关分析,求回归系数所遵循的原则:
将所求出的回归系数代入经验公式后计算出的数值,应与实测数据呈最佳近似。
10,6/17/2019,问题关键:
回归问题就是根据实验数据确定多项式系数即回归系数b0,b1,b2,b3的问题(幂指数或系数)。
DataProcessing)第5章回归分析与相关分析,5.2一元线性回归方程的建立,实验值:
(xi,yi)(i1,2,n)。
数据具有直线趋向时,曲线结构式可设为:
用一个确定函数关系式近似表达时,便得到回归方程:
-变量y的理论估计值或回归值问题关键:
怎样根据实测数据,确定回归系数a,b,11,6/17/2019,第5章回归分析与相关分析,最小二乘法:
最小二乘法就是使含有随机误差的各实测值与回归值的偏差平方和q达到最小,从而确定回归系数a、b的方法。
如何衡量实测值与回归值的总偏差?
偏差平方和q:
DataProcessing)分析:
实测值yi与回归值的偏差i为:
12,6/17/2019,试验设计与数据处理(ExperimentDesign&
DataProcessing),第5章回归分析与相关分析,要使q取最小值,即有,经简单推导,可求得,其中,13,6/17/2019,试验设计与数据处理,(ExperimentDesign&
DataProcessing),第5章回归分析与相关分析,回归直线通过实验观测值的平均值(,)组成的点!
因此,回归方程可写为或,14,6/17/2019,15,6/17/2019,试验设计与数据处理(ExperimentDesign&
DataProcessing),第5章回归分析与相关分析,例:
为了研究氮含量对铁合金溶液初生奥氏体析出温度的影响,测定了不同氮含量时铁合金溶液初生奥氏体析出温度,得到下表给出的5组数据。
表1氮含量与灰铸铁初生奥氏体析出温度测试数据,试验设计与数据处理,(ExperimentDesign&
DataProcessing),第5章回归分析与相关分析,如果把氮含量作为横坐标,把初生奥氏体析出温度作为纵坐标,将这些数据标在平面直角坐标上,则得图1,这个图称为散点图。
16,6/17/2019,试验设计与数据处理(ExperimentDesign&
DataProcessing)第5章回归分析与相关分析,得出:
a=1231.65b=-2236.63因此,在例1中灰铸铁初生奥氏体析出温度(y)与氮含量(x)的回归关系式为:
现在我们来建立关于例1的回归关系式。
将表中的结果代入,17,6/17/2019,试验设计与数据处理(ExperimentDesign&
DataProcessing),第5章回归分析与相关分析,求回归方程的列表算法,将求b的关系式中分子、分母等单项参数分别计算,令,采用这些符号,回归系数的计算公式便十分简单,这时,18,6/17/2019,试验设计与数据处理(ExperimentDesign&
DataProcessing)第5章,回归分析与相关分析,一、回归平方和与剩余平方和影响实测值yi变动的有两方面因素:
当x取不同的xi时,引起了yi的变化。
试验误差及其它随机因素对yi的影响。
由于两方因素的综合作用,使n个yi与其平均值产生差异,为总变差平方和SST为:
19,6/17/2019,希望:
第
(1)个因素是主要因素,第
(2)个因素是次要因素。
5.3一元线性回归方程的检验方法,试验设计与数据处理,(ExperimentDesign&
DataProcessing),第5章回归分析与相关分析,令,(回归平方和),20,6/17/2019,回归平方和SSR:
是由自变量x的变化所引起的y值的变差。
它反映了总变差SST中由于x和y的线性关系所引起的变差部分。
DataProcessing),第5章回归分析与相关分析,(剩余平方和)剩余平方和SS:
是试验误差及其它随机因素对变量yi观测结果的影响。
它反映了总变差SST中去掉回归平方和SSR后的剩余部分。
则,21,6/17/2019,或,偏差平方和q:
DataProcessing)第5章回归分析与相关分析,二、相关系数rxy,用回归平方和SSR在总变差SST中所占的比例来表示x与y两个变量间线性关系的相关程度。
22,6/17/2019,试验设计与数据处理,(ExperimentDesign&
DataProcessing),第5章回归分析与相关分析,所以,rxy与q的关系:
23,6/17/2019,试验设计与数据处理(ExperimentDesign&
DataProcessing),第5章回归分析与相关分析,相关系数的意义:
当|rxy|等于1时,q=0,所有观测点都落在回归直线上,x和y完全线性相关(精确的线性关系);
当|rxy|=0时,q最大,x和y线性无关;
|rxy|越大,越靠近于1时,则q越小,表明x与y间线性关系越密切。
24,6/17/2019,试验设计与数据处理,(ExperimentDesign&
DataProcessing),第5章回归分析与相关分析,
(2),y,x,y,x,
(1),r,xy,rxy,y,x,rxy,(5),y,xx,y,(4),xy,r,-,rxy,(6),y,x,(3)rxy-,正相关:
rxy0,y随x的增加而增加负相关:
rxy,y随x的增加而减少,25,6/17/2019,26,6/17/2019,试验设计与数据处理(ExperimentDesign&
DataProcessing),第5章回归分析与相关分析,相关性检验一般利用相关系数检验表(见附录)进行。
该表中给出的rxy值为相关系数的起码值。
只有当求出的相关系数大于表上相应的数值时,才能考虑用直线来描述x和y之间的相关关系。
查表时要遇到三个参数:
变量总数、自由度和置信水平。
对于一元回归分析,变量只有两个(x,y)。
自由度等于数据组数与变量个数之差。
显著性水平(5%和1%)表示线性相关的程度。
如果|rxy|小于表上相应的值时,称为x与y没有明显的线性关系,即回归方程没有实际意义。
通常当|rxy|大于表上,相应的值时,,相应的值,但小于表上,称为x与y有显著的线性关系;
如果|rxy|大于表上,相应的值时,称x与y有十分显著的线性关系;
DataProcessing)第5章回归分析与相关分析,三、r检验法,问题:
rxy的绝对值多大,才能表明变量间线性相关是密切的,所建立的回归方程才有实际意义呢?
思路:
根据风险度,变量x和y成对观察的次数n和自由度f查相关系数检验表,得到的r值为相关系数的起码值。
只有当计算出的rxy大于r时才能考虑用直线来描述x和y之间的相关关系。
步骤:
计算相关系数rxy值。
确定风险度和自由度f(f为变量x和y成对观察的次数n与变量数目2之差,即f=n-2),查表确定相关系数临界值r。
27,6/17/2019,试验设计与数据处理(ExperimentDesign&
DataProcessing),第5章回归分析与相关分析,(3)比较rxy与r。
rxy,如r,则认为在(1-)置信度下,变量x与y之间,线性相关显著,此时所建立的回归方程有应用价值;
反之,,rxy,当r时,变量x与y之间不存在线性相关关系,此时,SSR在SST中占的比例越大,SS(即q)在SST中所占的比例就越小。
用SSR和SS的比值大小来判断回归效果的好坏。
所建立的回归方程无实际意义。
三、F检验法(方差检验法)分析:
28,6/17/2019,试验设计与数据处理(ExperimentDesign&
DataProcessing),第5章回归分析与相关分析,方差MST:
回归方程的变差平方和SST与其自由度fT之商。
回归方差MSR:
回归方程的回归变差平方和SSR与其自由度fT之商。
29,6/17/2019,剩余方差MS:
回归方程的剩余变差平方和SS与其自由度f之商。
DataProcessing),第5章回归分析与相关分析,定义:
F函数,fR自变量的数目。
一元线性回归fR=1fSST的自由度(n-1)减去fR,即fn-2。
(F服从F分布)思路:
根据风险度,在F分布表上查Fn-。
当计算出的F大于F时,说明该线性回归方程显著,原假设可靠;
当F小于F时,说明该线性回归方程不显著,原假设不成立。
30,6/17/2019,试验设计与数据处理(ExperimentDesign&
DataProcessing),第5章回归分析与相关分析,四、F检验法与r检验法比较,F相关系数rxy方程特点:
当rxy时,F;
rxy越大,F也越大,回归方程的效果越好;
当rxy等于时,F趋于无穷大。
F检验法与r检验法检验结果一致,不需要了解相关系数时,用F检验法即可。
31,6/17/2019,试验设计与数据处理(ExperimentDesign&
DataProcessing),第5章回归分析与相关分析,五、回归线的精度,问题:
实测的y值与回归值的精度如何?
的偏差有多大?
即回归线预报,分析:
如果能计算出实测值的波动范围即标准差,则可估计回归线的精度。
剩余方差MS是排除了x对y的线性影响后(即x固定时),衡量y随机波动大小的一个估计量。
剩余标准差S:
剩余方差的平方根,32,6/17/2019,试验设计与数据处理,(ExperimentDesign&
DataProcessing),第5章回归分析与相关分析,可见,当rxy时,S;
当rxy时,S值最大。
所以S值越小,回归方程效果越好;
反之,则越差。
剩余标准差S作为回归方程的误差,可以对回归方程的效果做出判断S值越小,从回归方程中预报变量y的值,就越精确,因而S可用来预报回归方程的精度。
33,6/17/2019,试验设计与数据处理(ExperimentDesign&
DataProcessing),第5章回归分析与相关分析,误差界取为-,时,置信概率为0.6827误差界取为-2,时,置信概率为0.9545误差界取为-3,时,置信概率为0.9973对于同一个xi,y的实测值yi是以回归值为中心对称分布的。
与剩余标准差S的关系如下:
yi落在yi落在yi落在,34,6/17/2019,区间的概率为0.6827区间的概率为0.9545区间的概率为0.9973,均方根误差是表示实验精确度的较好方法。
越小,表明数据越集中,测量精度越高。
35,6/17/2019,试验设计与数据处理(ExperimentDesign&
DataProcessing),第5章回归分析与相关分析,5.4一元线性回归方程的应用,一、回归方程的建立过程1、实验样本的准备;
2、作出实验数据的散点图;
3、计算回归系数a与b,初步建立回归方程;
4、对回归方程进行显著性检验;
5、确定自变量x的有效区间。
即存在线性相关的范围;
6、技术预测与控制。
DataProcessing),第5章回归分析与相关分析,二、回归方程的应用,例2为探讨某滑动轴承的磨损量Q与油温T的关系,使10个轴承分别在不同油温下,测定其磨损量,得到如下试验数据。
试求其回归方程,并进行精度检验解1)作散点图,寻求回归,方程形式,Cm/100h,。
磨损,工作温度(),36,6/17/2019,试验设计与数据处理(ExperimentDesign&
DataProcessing),第5章回归分析与相关分析,求回归方程的系数a,b。
回归方程,37,6/17/2019,试验设计与数据处理(ExperimentDesign&
DataProcessing),第5章回归分析与相关分析,回归方程的显著性检验相关系数检验法,38,6/17/2019,试验设计与数据处理(ExperimentDesign&
DataProcessing),第5章回归分析与相关分析,回归方程的显著性检验,给定显著性水平0.01,按自由度n-2=8,在相关系数检验表上查得临界相关系数r0.7646。
结论:
在99的可信度下,滑动轴承的磨损量与油温间的回归方程特别显著,回归方程有实际价值。
39,6/17/2019,试验设计与数据处理,(ExperimentDesign&
DataProcessing),第5章回归分析与相关分析,F检验法,取;
fR;
fn-。
则,结论:
回归方程在的可信度下特别显著。
40,6/17/2019,试验设计与数据处理(ExperimentDesign&
DataProcessing),第5章回归分析与相关分析,回归方程的剩余标准差,推论:
(置信概率为0.6827)(置信概率为0.9545)(置信概率为0.9973),41,6/17/2019,试验设计与数据处理(ExperimentDesign&
DataProcessing)第5章,回归分析与相关分析,5.5一元非线性回归分析,问题:
变量间的关系并不限于线性相关,非线性相关的问题怎么解决?
、确定函数类型,通过变量变换,将非线性关系化成线性关系。
、如曲线类型不易判断时,采用多项式进行逼近。
一元非线性关系:
用下列回归方程表达:
回归参数由最小二乘法确定。
42,6/17/2019,试验设计与数据处理(ExperimentDesign&
DataProcessing),第5章回归分析与相关分析,考虑n=2的情况:
为了求得上式中的a,b值,先写出偏差平方和q(a,b1,b2)的表达式,然后分别对a,b,b求偏导并使其结果等于零。
从而可得到如下的正规方程组正规方程组,43,6/17/2019,联解正规方程组,即可计算出回归系数a,b1,b2。
DataProcessing),第5章回归分析与相关分析,相关系数r,剩余标准差Syx,44,6/17/2019,试验设计与数据处理(ExperimentDesign&
DataProcessing)第5章回归分析与相关分析,例3炼钢厂出钢时所用的盛钢水的钢包,在使用过程中由于钢液及炉渣对包衬耐火材料的侵蚀,使其容积不断增大。
经过试验,钢包的容积(以钢包盛满钢水时的重量来表示)与相应的使用次数(即包龄)的测试数据如下表所示。
试建立钢包的容积与相应的使用次数间的回归方程。
45,6/17/2019,试验设计与数据处理(ExperimentDesign&
DataProcessing),第5章回归分析与相关分析,解:
先画出右图所示的测试数据的散点图。
从图形特点来看应选用双曲线来表示容积y与使用次数x之间的关系,即,令,则回归方程可写为,46,6/17/2019,试验设计与数据处理(ExperimentDesign&
DataProcessing)第5章回归分析与相关分析,对于y与x来说,可以用前述一元线性回归方程的建立方法求出a,b,计算过程列于下表。
47,6/17/2019,试验设计与数据处理(ExperimentDesign&
DataProcessing),第5章回归分析与相关分析,这样,可直接写出正规方程组,解方程组得a=0.008966,b=0.0008302,于是,48,6/17/2019,钢包的容积与相应的使用次数间的回归方程为,试验设计与数据处理(ExperimentDesign&
DataProcessing),第5章回归分析与相关分析,喷嘴直径与流量的关系表,例4.在燃气进口压力稳定时,试验某燃气灶的燃气喷嘴直径与流量的关系,测定结果如下表所示。
49,6/17/2019,试验设计与数据处理(ExperimentDesign&
DataProcessing)第5章回归分析与相关分析,设二阶方程,解为初步了解y与x的关系,将实验点绘在直角坐标图上。
应采用非线性方程来拟合。
由实验数据,可分别求出a=0.1954;
b=-4.09010-3;
1b2=1.065,10-3,喷嘴直径x(10-4m)图4-5例题4-3的曲线图,(h/m3),50,6/17/2019,流量,曲线方程y=0.1954-4.0910-3x+1.065103x2,试验设计与数据处理(ExperimentDesign&
DataProcessing),第5章回归分析与相关分析,现在进行相关性检验。
取,自由度f=n-2=14-2=12,查相关系数检验表,得rn。
有rr成立。
结论:
在99置信度下,自变量x与因变量y之间非线性相关显著,所求得的回归方程的效果是高度显著的。
回归方程为:
51,6/17/2019,52,6/17/2019,试验设计与数据处理(ExperimentDesign&
DataProcessing),第5章回归分析与相关分析,一元非线性回归问题转化为一元线性回归问题,具体做法如下:
1、根据实验所得数据,在直角坐标中划出散点图;
2、根据散点图,推测y与x之间的函数关系;
3、选择适当的交换,使之变成线性关系;
4、用线性回归方法求出线性回归方程;
5、返回到原来的函数关系,得到要求的回归方程。
DataProcessing)第5章回归分析与相关分析,5.6二元线性回归方程的建立与检验,一、二元线性回归方程的建立二元线性回归方程的典型形式:
偏差平方和q为,用最小二乘法求a,b,c。
53,6/17/2019,试验设计与数据处理(ExperimentDesign&
DataProcessing),第5章回归分析与相关分析,正规方程组,简便算法:
以n除上式中的第一项,得又有则:
54,6/17/2019,试验设计与数据处理(ExperimentDesign&
DataProcessing)第5章,回归分析与相关分析,将上式代入偏差的平方和q表达中,有:
最小二乘法求b,c,令:
55,6/17/2019,试验设计与数据处理(ExperimentDesign&
DataProcessing),第5章回归分析与相关分析,上式可简化为,联解此方程组,求出二元线性回归系数b、c值。
56,6/17/2019,试验设计与数据处理(ExperimentDesign&
DataProcessing)第5章回归分析与相关分析,SSR回归平方和SS剩余平方和当SSR越大或SS越小时,表示y与x、z的线性关系越密切,回归方程效果越好。
二、二元线性回归方程的方差检验(F检验法),1、总变差平方和SST为,57,6/17/2019,试验设计与数据处理(ExperimentDesign&
DataProcessing),第5章回归分析与相关分析,SST、SSR、SS的计算公式是:
其中:
58,6/17/2019,试验设计与数据处理(ExperimentDesign&
DataProcessing),第5章回归分析与相关分析,2、F检验法,fTfR+f=n-1fR2(有2个自变量)ffT-fR(n-1)-2=n-3,59,6/17/2019,60,6/17/2019,试验设计与数据处理(ExperimentDesign&
DataProcessing),第5章回归分析与相关分析,
(2)给定风险度,,根据F分布表查出相应的临界值,F(fR,f)。
(3)将F与F(fR,f)进行比较。
FF(fR,f),在(1-)置信度下,变量y与x、z间线性相