ImageVerifierCode 换一换
格式:DOCX , 页数:23 ,大小:1.02MB ,
资源ID:13077975      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bingdoc.com/d-13077975.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(方差分析报告报告材料线性回归.docx)为本站会员(b****6)主动上传,冰点文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰点文库(发送邮件至service@bingdoc.com或直接QQ联系客服),我们立即给予删除!

方差分析报告报告材料线性回归.docx

1、方差分析报告报告材料线性回归1 线性回归1.1 原理分析要研究最大积雪深度x与灌溉面积y之间的关系,测试得到近10年的数据如下表:使用线性回归的方法可以估计x与y之间的线性关系。线性回归方程式:对应的估计方程式为线性回归完成的任务是,依据观测数据集(x1,y1),(x2,y2),.,(xn,yn)使用线性拟合估计回归方程中的参数a和b。a,b都为估计结果,原方程中的真实值一般用和表示。为什么要做这种拟合呢?答案是:为了预测。比如根据前期的股票数据拟合得到股票的变化趋势(当然股票的变化可就不是这么简单的线性关系了)。线性回归的拟合过程使用最小二乘法,最小二乘法的原理是:选择a,b的值,使得残差的

2、平方和最小。为什么是平方和最小,不是绝对值的和?答案是,绝对值也可以,但是,绝对值进行代数运算没有平方那样的方便,4次方又显得太复杂,数学中这种“转化化归”的思路表现得是那么的优美!残差平方和Q,求最小,方法有很多。代数方法是求导,还有一些运筹学优化的方法(梯度下降、牛顿法),这里只需要使用求导就OK了,为表示方便,引入一些符号,最终估计参数a与b的结果是:自此,针对前面的例子,只要将观测数据带入上面表达式即可计算得到拟合之后的a和b。不妨试一试?从线性函数的角度,b表示的拟合直线的斜率,不考虑数学的严谨性,从应用的角度,结果的b可以看成是离散点的斜率,表示变化趋势,b的绝对值越大,表示数据的

3、变化越快。线性回归的估计方法存在误差,误差的大小通过Q衡量。1.2 误差分析考虑获取观测数据的实验中存在其它的影响因素,将这些因素全部考虑到eN(0,2)中,回归方程重写为y = a + bx + e由此计算估计量a与b的方差结果为,a与b的方差不仅与和x的波动大小有关,而且还与观察数据的个数有关。在设计观测实验时,x的取值越分散,估计ab的误差就越小,数据量越大,估计量b的效果越好。这也许能为设计实验搜集数据提供某些指导。1.3 拟合优度检验及统计量拟合优度检验模型对样本观测值的拟合程度,其方法是构造一个可以表征拟合程度的指标,称为统计量,统计量是样本的函数。从检验对象中计算出该统计量的数值

4、,然后与某一标准进行比较,得出检验结论。这是又会问了,最小二乘法不是保证了模型最好的拟合样本观测值了吗?为什么还要检验拟合程度?最小二乘法保证的是同一个样本集使用最小二乘法拟合程度最好,而拟合优度检验结果表示的是多个不同样本集各自进行拟合后对拟合效果的比较。比如,下面的直线方程都是使用最小二乘法拟合的结果,但二者对样本观测值的拟合程度显然不同。为构造统计量,先定义三个表达式:通过推倒可以发现:表示观测值y1,y2,y3,.yn与它们的平均值的离差平方和,越大,则观测值的波动越大。因此称总离差平方和。表示回归直线上点的纵坐标y1,y2,.,yn与与观测值均值的离差平方和。所以称为回归平方和。反映

5、出回归直线因素对的影响。是最小二乘法中残差平方和Q的最小值,它是实际观测值yi与回归直线上的点(xi,yi)的纵坐标yi的离差平方和。是扣除线性影响外的剩余平方和,因此称为残差平方和。显然,一个拟合得比较好的模型,与应该比较接近,而应该尽可能的小。因此,可以通过构造某种与的表达式作为拟合优度检验中的统计量。 构造统计量相关系数因此,构造相关系数不同的r值有不同的线性相关表示,如下图结论:当|r|-0时,表示x与y之间的线性关系不明显,不适合使用线性回归建模。反之,当|r|越接近1时,表示x与y之间的线性关系越密切。 构造统计量FF值越小表示线性关系越密切,反之线性关系越弱。 构造统计量t|t|

6、越大,x与y之间的线性关系越密切;反之,越小,x与y之间的线性关系越微弱。不管是相关系数,还是F,或者t,都能用于描述x与y之间的线性相关程度。并且可以通过验证,这三种统计量用于下面的显著性检验是完全一致的。1.4 显著性检验显著性检验,以开头“最大积雪深度x与灌溉面积y之间的关系”的线性关系是否显著为例,使用上面构造的统计量进行显著性检验的过程如下:在当中,计算线性回归及显著性检验使用到如下的公式,下面的公式不用记住,使用时查询即可。相关系数的查表参见相关系数显著性检验表1.5 置信区间回归系数以1-为置信度的置信区间为回归系数以1-为置信度的置信区间为其中S都为,1.6 使用Matlab做

7、回归分析使用最小二乘法做多元线性回归分析的函数为:b,bint,r,rint,stats = regress(y,X,alpha);% alpha 为显著性水平% b bint 为回归系数估计值向量及其置信区间% r rint 为残差向量及其置信区间,可用rcoplot(r,rint)绘图下面是一个使用Matlab做线性回归分析的实例:EG: x 0.10 0.11 0.12 0.13 0.14 0.15 0.16 0.17 0.18 y 42.0 41.5 45.0 45.5 45.0 47.5 49.0 55.0 50.0 Matlab代码如下:clear allclfclose all%

8、 绘制(X,Y)散点图figure,x=0.1:0.01:0.18; y=42,41.5,45.0,45.5,45.0,47.5,49.0,55.0,50.0; plot(x,y,+) % 线性回归分析x1=x; y1=y; x2=ones(9,1),x1; b,bint,r,rint,stats=regress(y1,x2); % 绘制拟合直线y = b(2)*x + b(1);hold on,plot(x,y,r);% 绘制残差图figure,rcoplot(r,rint);结果为拟合直线图和残差图如下:在Matlab中还可以使用polyfit函数非常方便的对数据进行拟合,polyfit除

9、了能进行线性拟合,还可以进行非线性的拟合。使用polyfit拟合方法如下:% 绘制(X,Y)散点图figure,x=0.1:0.01:0.18; y=42,41.5,45.0,45.5,45.0,47.5,49.0,55.0,50.0; plot(x,y,+); % 绘制拟合直线hold on, p = polyfit(x,y,1);y = p(1).*x + p(2);plot(x,y2,r);拟合结果与上面的一样。1.7 回归分析的实际操作步骤回归分析的主要内容是通过试验或观测数据,寻找相关变量之间的统计规律性,再利用自变量的值有效预测因变量的可能取值。其实际操作的步骤是:1. 设定回归方

10、程2. 根据误差分析,考虑搜集数据对回归方程参数的影响,有目的的搜集数据3. 确定回归系数4. 进行相关性检验5. 预测2 方差分析2.1 引入如上图,对A1A4共4种不同灯丝的灯泡进行抽样检测灯泡寿命,根据测试数据,现在要问:灯泡寿命是否与灯丝材料的不同有关。问题特点有: 1项指标(因变量):寿命 影响指标的因素(因子):灯丝 因素存在多个不同状态(水平),要求分析因素的不同状态是否对指标有显著影响这就是方差分析问题:用数理统计分析试验结果、鉴别各因素对结果影响程度的方法称为方差分析(Analysis Of Variance),记作ANOVA。2.2 单因素方差分析其它因素不变,只考虑一个因

11、素A,因素存在多个水平,在每个水平上做若干次实验,从实验结果推断是否该因素对指标有显著影响?这就是单因素的方差分析,上面的例子就是单因素方差分析的例子。 前提假设设因素A的r个水平为A1,A1,.,Ar,每个水平下的指标服从正态分布N(u1,2),N(u2,2),.,N(ur,2)。 模型建立实验数据的格式:因子对指标是否有影响取决于指标的正态分布是否一致,如果有影响,则正态分布应该存在差异,而正态分布由均值和方差决定,假设中方差相同,因此各个水平下的正态分布均值直接决定因素是否对指标有影响。所以,问题可以转化为假设检验,设H0: u1=u2=u3=.=ur检验结果如果拒绝原假设,则认为因素A

12、对指标有显著影响,否则认为无显著影响。设u = (1/r)sum_1auii = ui - u则,H0假设改写成H0: 1=2=3=.=r=0 构造统计量(摘自数学建模Matlab大全) 单因素方差分析表过对上面模型中相关参数进行计算,为计算分析方便,将结果填入下表中:表中的Pr反映的就是F值的概率,F值通过因素A均方除以误差均方获得。因此,有1. 如果Pr大于,则接受H0,因素对指标无显著影响2. 如果Pr小于,则拒绝H0,因素对指标有显著影响Matlab的输出结果即为上面的方差分析表,因此,用matlab很容易进行方差分析。2.3 用Matlab进行单因素方差分析能否认为这三所小学五年级男

13、学生的平均身高相同?取显著水平=0.05.假设H0: 这三所小学五年级男学生的平均身高相同。data = .128.1 134.1 131.1 138.9 140.8 127.4; .150.3 147.9 136.8 126.0 150.7 155.8; .140.6 143.1 144.5 143.7 148.5 146.4.;data = data;P=anova1(data); % 方差分析函数anova1Matlab程序的运行结果为: Pr=0.0275 help anova2查看anova2函数的使用方法。对无交互关系的双因素方差分析,此时每个单元只需要测一个值,reps=1对于交

14、互关系的双因素方差分析,此时每个单元需要测多个值(t1),reps=2参数x的格式为:% 列因素有3个水平(s=3),行因素有2个水平(r=2),每组测试2个数据(t=2)x =x111 x121 x131 x112 x122 x132 x211 x221 x231 x221 x222 x2321. 无交互作用双因素方差分析的例子一种火箭使用了四种燃料、三种推进器,进行射程试验,对于每种燃料与每种推进器的组合作一次试验,得到如下数据表,问各种燃料之间及各种推进器之间有无显著差异?设显著性水平=0.05.Matlab解题代码如下:x=58.2 56.2 65.3 49.1 54.1 51.6 6

15、0.1 70.9 39.2 75.8 58.2 48.7; p,t,st=anova2(x,1); 分析结果的方差分析表如下:求得p=0.4491 0.7387,都大于,所以各种燃料之间及各种推进器的差异都对火箭射程没影响。2. 有交互作用双因素方差分析的例子一种火箭使用了四种燃料、三种推进器,进行射程试验,对于每种燃料与每种推进器的组合作2次试验,得到如下数据表,问各种燃料之间及各种推进器之间有无显著差异?两因素的交互作用是否显著?设显著性水平=0.05.Matlab解题代码如下:x0=58.2,52.6 56.2,41.2 65.3,60.8 49.1,42.8 54.1,50.5 51.

16、6,48.4 60.1,58.3 70.9,73.2 39.2,40.7 75.8,71.5 58.2,51.0 48.7,41.4; x1=x0(:,1:2:5);x2=x0(:,2:2:6); for i=1:4 x(2*i-1,:)=x1(i,:); x(2*i,:)=x2(i,:); endp,t,st=anova2(x,2);分析结果的方差分析表如下:求得p= 0.0035 0.0260 0.0001,都小于,所以各实验均值相等的概率很小,认为不同燃料、不同推进器下的射程有显著差异,交互作用也是显著的。3 回归分析与方差分析的比较回归分析与方差分析之间都是研究相关关系的统计方法,就我

17、理解,两者之间的差异在于:1. 回归分析在于建立自变量与因变量之间的定量关系(表达式),这种定量的关系可用于将来的预测(如:根据14年以前的房价数据建立回归模型,可用于14年的房价预测);方差分析在于解释因素的不同水平(状态)是否对指标有显著影响,如有显著影响,其具体影响的定量关系还需要用其它方法做进一步的分析(如:通过测试试验数据,分析货币的价值(因素)是否对房价(指标)有显著影响,方差分析无法提供房价与货币价值间的定量表达式)2. 应用上:当不确定谋因素是否对指标有影响时,可先测量小部分数据,做方差分析。若确定因素对指标有影响,则增加测量因素在不同状态下的数据,进一步用回归分析确定因素与指标之间的定量关系。否则认为因素与指标之间无关。

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2