线性回归推导及实例Word下载.docx

上传人:b****1 文档编号:3779099 上传时间:2023-05-02 格式:DOCX 页数:16 大小:99.52KB
下载 相关 举报
线性回归推导及实例Word下载.docx_第1页
第1页 / 共16页
线性回归推导及实例Word下载.docx_第2页
第2页 / 共16页
线性回归推导及实例Word下载.docx_第3页
第3页 / 共16页
线性回归推导及实例Word下载.docx_第4页
第4页 / 共16页
线性回归推导及实例Word下载.docx_第5页
第5页 / 共16页
线性回归推导及实例Word下载.docx_第6页
第6页 / 共16页
线性回归推导及实例Word下载.docx_第7页
第7页 / 共16页
线性回归推导及实例Word下载.docx_第8页
第8页 / 共16页
线性回归推导及实例Word下载.docx_第9页
第9页 / 共16页
线性回归推导及实例Word下载.docx_第10页
第10页 / 共16页
线性回归推导及实例Word下载.docx_第11页
第11页 / 共16页
线性回归推导及实例Word下载.docx_第12页
第12页 / 共16页
线性回归推导及实例Word下载.docx_第13页
第13页 / 共16页
线性回归推导及实例Word下载.docx_第14页
第14页 / 共16页
线性回归推导及实例Word下载.docx_第15页
第15页 / 共16页
线性回归推导及实例Word下载.docx_第16页
第16页 / 共16页
亲,该文档总共16页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

线性回归推导及实例Word下载.docx

《线性回归推导及实例Word下载.docx》由会员分享,可在线阅读,更多相关《线性回归推导及实例Word下载.docx(16页珍藏版)》请在冰点文库上搜索。

线性回归推导及实例Word下载.docx

三、正规方程组

根据微分中求极值的方法可知,Q(a,b)取得最小值应满足

 

(2-1-3)

由(2-1-2)式,并考虑上述条件,则

(2-1-4)

(2-1-4)式称为正规方程组。

解这一方程组可得

(2-1-5)

其中

(2-1-6)

(2-1-7)

式中,Lxy称为xy的协方差之和,Lxx称为x的平方差之和。

如果改写(2-1-1)式,可得

(2-1-8)

(2-1-9)

由此可见,回归直线是通过点

的,即通过由所有实验测量值的平均值组成的点。

从力学观点看,

即是N个散点

的重心位置。

现在我们来建立关于例1的回归关系式。

将表2-1-1的结果代入(2-1-5)式至(2-1-7)式,得出

a=1231.65

b=-2236.63

因此,在例1中灰铸铁初生奥氏体析出温度(y)与氮含量(x)的回归关系式为

y=1231.65-2236.63x

四、一元线性回归的统计学原理

如果X和Y都是相关的随机变量,在确定x的条件下,对应的y值并不确定,而是形成一个分布。

当X取确定的值时,Y的数学期望值也就确定了,因此Y的数学期望是x的函数,即

E(Y|X=x)=f(x) 

(2-1-10)

这里方程f(x)称为Y对X的回归方程。

如果回归方程是线性的,则

E(Y|X=x)=α+βx 

(2-1-11)

Y=α+βx+ε 

(2-1-12)

ε―随机误差

从样本中我们只能得到关于特征数的估计,并不能精确地求出特征数。

因此只能用f(x)的估计式 

来取代(2-1-11)式,用参数a和b分别作为α和β的估计量。

那么,这两个估计量是否能够满足要求呢?

1.无偏性

把(x,y)的n组观测值作为一个样本,由样本只能得到总体参数α和β的估计值。

可以证明,当满足下列条件:

(1)(xi,yi)是n个相互独立的观测值

(2)εi是服从

分布的随机变量

则由最小二乘法得到的a与b分别是总体参数α和β的无偏估计,即

E(a)=α

E(b)=β

由此可推知

E(

)=E(y)

即y是回归值

在某点的数学期望值。

2.a和b的方差

可以证明,当n组观测值(xi,yi)相互独立,并且D(yi)=σ2,时,a和b的方差为

(2-1-13)

(2-1-14)

以上两式表明,a和b的方差均与xi的变动有关,xi分布越宽,则a和b的方差越小。

另外a的方差还与观测点的数量有关,数据越多,a的方差越小。

因此,为提高估计量的准确性,xi的分布应尽量宽,观测点数量应尽量多。

建立多元线性回归方程,实际上是对多元线性模型(2-2-4)进行估计,寻求估计式(2-2-3)的过程。

与一元线性回归分析相同,其基本思想是根据最小二乘原理,求解

使全部观测值

与回归值

的残差平方和达到最小值。

由于残差平方和

(2-2-5)

的非负二次式,所以它的最小值一定存在。

根据极值原理,当Q取得极值时,

应满足

由(2-2-5)式,即满足

(2-2-6)

(2-2-6)式称为正规方程组。

它可以化为以下形式

(2-2-7)

如果用A表示上述方程组的系数矩阵可以看出A是对称矩阵。

则有

(2-2-8)

式中X是多元线性回归模型中数据的结构矩阵,

是结构矩阵X的转置矩阵。

(2-2-7)式右端常数项也可用矩阵D来表示

因此(2-2-7)式可写成

Ab=D 

(2-2-10)

(2-2-11)

如果A满秩(即A的行列式 

)那么A的逆矩阵A-1存在,则由(2-10)式和(2-11)式得

的最小二乘估计为

(2-2-12)

也就是多元线性回归方程的回归系数。

为了计算方便往往并不先求 

,再求b,而是通过解线性方程组(2-2-7)来求b。

(2-2-7)是一个有p+1个未知量的线性方程组,它的第一个方程可化为

(2-2-13)

式中

(2-2-14)

将(2-2-13)式代入(2-2-7)式中的其余各方程,得

(2-2-15)

(2-2-16)

将方程组(2-2-15)式用矩阵表示,则有

Lb=F 

(2-2-17)

于是

b=L-1F 

(2-2-18)

因此求解多元线性回归方程的系数可由(2-2-16)式先求出L,然后将其代回(2-2-17)式中求解。

求b时,可用克莱姆法则求解,也可通过高斯变换求解。

如果把b直接代入(2-2-18)式,由于要先求出L的逆矩阵,因而相对复杂一些。

例2-2-1 

表2-2-1为某地区土壤内含植物可给态磷(y)与土壤内所含无机磷浓度(x1)、土壤内溶于K2CO3溶液并受溴化物水解的有机磷浓度(x2)以及土壤内溶于K2CO3溶液但不溶于溴化物的有机磷(x3)的观察数据。

求y对x1, 

x2, 

x3的线性回归方程 

表2-2-1 

土壤含磷情况观察数据

计算如下:

由(2-2-16)式

代入(2-2-15)式得

(2-2-19)

若用克莱姆法则解上述方程组,则其解为

(2-2-20)

计算得

b1=1.7848,b2=-0.0834,b3=0.1611

回归方程为

应用克莱姆法则求解线性方程组计算量偏大,下面介绍更实用的方法——高斯消去法和消去变换。

在上一节所介绍的非线性回归分析,首先要求我们对回归方程的函数模型做出判断。

虽然在一些特定的情况下我们可以比较容易地做到这一点,但是在许多实际问题上常常会令我们不知所措。

根据高等数学知识我们知道,任何曲线可以近似地用多项式表示,所以在这种情况下我们可以用多项式进行逼近,即多项式回归分析。

一、多项式回归方法

假设变量y与x的关系为p次多项式,且在xi处对y的随机误差 

(i=1,2,…,n)服从正态分布N(0,

),则

xi1=xi,xi2=xi2,…,xip=xip

则上述非线性的多项式模型就转化为多元线性模型,即

这样我们就可以用前面介绍的多元线性回归分析的方法来解决上述问题了。

其系数矩阵、结构矩阵、常数项矩阵分别为

(2-4-11)

(2-4-12)

(2-4-13)

回归方程系数的最小二乘估计为

(2-4-14)

需要说明的是,在多项式回归分析中,检验bj是否显著,实质上就是判断x的j次项xj对y是否有显著影响。

对于多元多项式回归问题,也可以化为多元线性回归问题来解决。

例如,对于

(2-4-15)

令xi1=Zi1,xi2=Zi2,xi3=Zi12,xi4=Zi1Zi2,xi5=Zi22

则(2-4-15)式转化为

转化后就可以按照多元线性回归分析的方法解决了。

下面我们通过一个实例来进一步说明多项式回归分析方法。

一、应用举例

例2-4-2 

某种合金中的主要成分为元素A和B,试验发现这两种元素之和与合金膨胀系数之间有一定的数量关系,试根据表2-4-3给出的试验数据找出y与x之间的回归关系。

表2-4-3 

例2-4-2试验数据

首先画出散点图(图2-4-3)。

从散点图可以看出,y与x的关系可以用一个二次多项式来描述:

i=1,2,3…,13

图2-4-3 

例2-4-2的散点图

xi1=xi,xi2=xi2,

现在我们就可以用本篇第二章介绍的方法求出

的最小二乘估计。

由表2-4-3给出的数据,求出

由(2-2-16)式

由此可列出二元线性方程组

将这个方程组写成矩阵形式,并通过初等变换求b1,b2和系数矩阵L的逆矩阵L-1:

b1=-13.3854

b2=0.16598

b0=2.3323+13.3854

40-0.16598

1603.5=271.599

因此

下面对回归方程作显著性检验:

由(2-2-43)式

S回=

由(2-2-42)式

S总=

S残=Lyy-S回=0.2572

将上述结果代入表2-2-2中制成方差分析表如下:

表2-4-4 

方差分析表

查F检验表,F0。

01(2,10)=7.56,F>

F0.01(2,10),说明回归方程是高度显著的。

下面对回归系数作显著性检验

由前面的计算结果可知:

b1=-13.3854 

b2=0.16598

c11=51.125 

c22=7.9916

10-3

由(2-2-54)式

由(2-2-53)式

检验结果说明的x一次及二次项对y都有显著影响。

Welcome!

!

欢迎您的下载,

资料仅供参考!

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 工程科技 > 能源化工

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2