ImageVerifierCode 换一换
格式:DOCX , 页数:25 ,大小:203.61KB ,
资源ID:14160853      下载积分:5 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bingdoc.com/d-14160853.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(数学实验报告利用MALTAB进行回归分析.docx)为本站会员(b****1)主动上传,冰点文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰点文库(发送邮件至service@bingdoc.com或直接QQ联系客服),我们立即给予删除!

数学实验报告利用MALTAB进行回归分析.docx

1、数学实验报告利用MALTAB进行回归分析实验十 回归分析一、影院收入问题描述 调查电视广告费用和报纸广告费用对每周收入的影响,得到数据,建立回归模型并进行检验,诊断异常点的存在并进行处理.简要分析本题属于多元回归分析,题目要求建立模型并进行检验。由于对于广告相关的知识不够了解,这里分别使用线性和多项式模型进行求解。建立模型见下节。 结果与分析首先画出三维散点图像,通过旋转观察趋势。可以大致看出,电影院收入与广告费的投入正相关。分别画出y与x1,y与x2的散点图。可以大概看出电视广告费用与电影院收入的正相关趋势,但是并不明显。可以看出报纸广告费用与电影院收入有着更好的正相关趋势。1、多元线性回归

2、 y = 0 + 1*x1 + *x2 y表示电影院收入,x1表示电视广告费,x2表示报纸广告费。 使用regress命令进行回归分析,得得到如下结果:b = 8.321160927008884e+001 1.298462204894947e+0002.337159771857618e+000即y = 83.2111.298x12.337x2bint = 7.880577047978311e+001 8.761744806039458e+001 4.007003329151720e-001 2.196224076874721e+000 1.485971104375634e+000 3.1883

3、48439339602e+000s =9.088948325450431e-001 2.494081449865064e+001 2.505287241894694e-0034.896902750703929e-001验证模型的有效性:(1)1、2的置信区间不含零点,说明有效;(2)R2约为0.91,说明有效性较好;(3) 1、2置信区间较大,说明有效性还不够好作出残差的置信区间图:可以看出第一个点的置信区间不包含零点,认为这个数据异常,将其取出再次计算。b = 8.148805113915761e+001 1.287657761022766e+000 2.976561219472206e+0

4、00bint = 7.878780950561033e+001 8.418829277270488e+001 7.963530683768555e-001 1.778962453668677e+000 2.328093878103018e+000 3.625028560841394e+000s = 9.768476263597862e-001 8.438423131380992e+001 5.360324051760790e-004 1.256843140468749e-001可以看出R2约为0.9768,较上次拟合有所提高,且1、2的置信区间有所减小,说明回归更加精确。2、多项式回归 建立模

5、型: y = 0 + 1*x1 + 2*x2 + 3*x12 + 4*x1*x2 + 5*x22 将之前剔除的离群点加入,进行回归分析得到:beta = 8.541353344890301e+001 -3.082142133837331e+000 3.886856973036645e+000 9.339761147729149e-001 2.830411521743378e-001 -4.748877056161781e-001剩余标准差s = 0.141484073634674剩余方差s2 = .020*可以看出剩余方差比之前两次回归分析得到的结果都小,说明模型更加准确。3、小结 从上面的实

6、验可以看出,使用二次回归模型更好地符合原问题,其实这是一个自然的结果,毕竟后者包含了前者的任意可能结果。不过此问题中线性规划已经取得了较好的结果,因此解决实际问题时不必使用二次回归模型。此外,在进行线性回归时,进行检验并剔除离群点会使拟合的精确度有很好的提高。程序清单1、线性模型clear;clc;y = 96 90 95 92 95 95 94 94;x1 = 1.5 2 1.5 2.5 3.3 2.3 4.2 2.5;x2 = 5 2 4 2.5 3 3.5 2.5 3;plot3(x1,x2,y,b*);grid on;X=ones(length(x1),1),x1,x2;b,bint,

7、r,rint,s=regress(y,X);bbintsrcoplot(r,rint);2、二次回归clear;clc;y = 96 90 95 92 95 95 94 94;x1 = 1.5 2 1.5 2.5 3.3 2.3 4.2 2.5;x2 = 5 2 4 2.5 3 3.5 2.5 3;X=x1,x2;rstool(X,y);rcoplot(r,rint);二、供货问题描述汽车销售商认为汽车销售量与汽油价格、贷款利率有关,给出两种类型汽车(普通型和豪华型)18个月的调查资料。(1)对普通型和豪华型汽车分别建立如下模型:给出的估计值和置信区间,决定系数,F值和剩余方差(2)用表示汽车

8、类型,建立统一模型:给出的估计值和置信区间,决定系数,F值和剩余方差等,以代入统一模型,将结果与(1)的两个模型的结果比较,解释两者的区别。(3)对统一模型就每种类型汽车分别作和与残差的散点图,有什么现象,说明模型有何缺陷(4)对统一模型增加二次项和交互项,考察结果有什么改进方法与模型 本题设计了多元线性回归以及残差分析、交互项等内容,具体方法和模型根据每一问的不同需要不断调整,具体内容见下一节。结果与分析1、线性回归首先画出y1与x1、x2,y2与x1、x2的三维图像。y1与x1、x2的图像: y2与x1、x2之间的关系:通过旋转观察到y1,y2都与x1,x2呈负相关。回归分析b1 = 9.

9、018136585730871e+001 -2.765882870806992e+001 -3.228346793716312e+000bint1 = 4.619708337901787e+001 1.341656483355995e+002 -5.455423361469730e+001 -7.634238014425385e-001 -4.274746088507830e+000 -2.181947498924794e+000s1 = 8.592850200702558e-001 4.579922943345883e+001 4.097816417303335e-007 2.0790961

10、40790696e+001b2 = 2.454705987370377e+001 -4.628453215108327e+000 -1.436031403352730e+000bint2 = 5.920074457824068e+000 4.317404528958348e+001 -1.601843815341429e+001 6.761531723197638e+000 -1.879172982685953e+000 -9.928898240195071e-001s2 = 8.402466171357945e-001 3.944736265068755e+001 1.06139118172

11、2549e-006 3.728762291889717e+000剔除离群点。得到:b1 = 1.075600951891631e+002 -3.792826917377474e+001 -3.031449173959885e+000bint1 = 7.531595365638566e+001 1.398042367219405e+002 -5.728422527544678e+001 -1.857231307210270e+001 -3.786243040717162e+000 -2.276655307202609e+000s1 = 9.333894507514000e-001 8.40758

12、2233869817e+001(F值) 8.734903034213204e-008 9.274571632833800e+000(剩余方差) b2 = 2.760195269937935e+001 -5.639268684072110e+000 -1.640688086715026e+000bint2 = 1.246313058112947e+001 4.274077481762922e+001 -1.488643040689478e+001 3.607893038750556e+000 -2.017510184513368e+000 -1.263865988916683e+000s2 =

13、9.219330114047505e-001 7.676182573405352e+001(F值)6.324675894120446e-008 2.028000209115517e+000(剩余方差)发现豪华车再次出现了离群点,这里不再剔除。2、统一模型修改X与Y,再次进行线性回归,得到结果如下:b = 6.457532397661750e+001 -1.614364096158921e+001 -2.332189098534525e+000 -1.442222222222222e+001 bint = 3.350074910681844e+001 9.564989884641656e+001

14、 -3.511933082065837e+001 2.832048897479957e+000 -3.070461995174191e+000 -1.593916201894859e+000 -1.765462575436173e+001 -1.118981869008271e+001 s =8.365956706337623e-001 5.461108153031960e+001 1.097566482144430e-012 2.266418048309717e+001发现了一个离群点这正是第一次回归时被剔除掉的那个。剔除掉再次进行计算,得到:b = 6.341072839681682e+0

15、01 -1.659325189834989e+001 -2.135885477561918e+000 -1.358235294117647e+001bint = 3.524089285479072e+001 9.158056393884291e+001 -3.379362808091857e+001 6.071242842187772e-001 -2.839717864163267e+000 -1.432053090960568e+000 -1.659600504370442e+001 -1.056870083864853e+001s = 8.435448032958891e-001 5.39

16、1606166276522e+001 3.408162640994306e-012 1.850878014942691e+001发现出现了两个离群点,但是考虑到他们离0较近,这里不再进行剔除。将得到的解化为(1)所设模型,对比如下:普通轿车豪华轿车分立模型统一模型分立模型统一模型0107.560095264.5753239827.601952750.153101751-37.92826917-16.14364096-5.639268684-16.143640962-3.031449174-2.332189099-1.640688087-2.332189099s29.27457163318.50

17、8780152.02800020918.50878015R20.9333894510.8435448030.9219330110.843544803可以看出,统一模型相当于将分立模型进行了统一:(1)统一模型的值趋近于给分立模型的“平均”;(2)统一模型的残差较大;(3)统一模型的决定系数较小;(4)统一模型的拒绝概率较小,到达了10的-12次方量级,说明模型更加有效;总体上讲,将两者统一后进行回归分析的结果有其优点,但是仍有许多不理想的成分。3、作残差图 普通轿车:豪华轿车:通过旋转,从图中可以看出,普通轿车的残差随着x1,x2的增加呈上升趋势,但豪华轿车的残差随x1,x2的增加呈下降趋势。

18、这是由于统一模型中x3的加入使得豪华轿车的y被直接抬高,导致了上述现象的出现。4、二次项和交互项(1)增加交互项,改用模型: 进行回归分析,得到: b = 1.411004377798469e+002 -5.743679205516632e+001 -1.258749562223860e+001 -6.563430598360479e+001 5.385499412767738e+000 1.792315390363587e+000 2.303037549296149e+001bint = 3.956253638526088e+001 2.426383391744329e+002 -1.170

19、970384200000e+002 2.223454309667375e+000 -3.029675426655443e+001 5.121763022077229e+000 -1.113383183433449e+002 -1.993029362386467e+001 -4.795263719990420e+000 1.556626254552590e+001 7.050032050169353e-001 2.879627575710239e+000 -4.916605769707012e+000 5.097735675562998e+001s = 9.203481760174530e-00

20、1 5.584742815672848e+001 1.276756478318930e-014 1.219057432979783e+001 发现R2、F和s2都有所改善,模型有效的概率也有所提高,但是x1,x2的置信区间都包含0,这应当是由于引入交互项x1x3和x2x3导致的。(2) 增加平方项,改用模型: 这里不增加x32是因为它和x3一样。 进行回归分析得到: b = -1.409670663904353e+002 2.173993993877811e+002 -6.002174836053398e+000 -1.442222222222222e+001 -6.2601809579969

21、29e+001 2.624522441422313e-001bint = -7.414504337579853e+002 4.595163009771146e+002 -4.561560206777966e+002 8.909548194533589e+002 -9.462597484034534e+000 -2.541752188072262e+000 -1.751423975213172e+001 -1.133020469231273e+001 -2.499892034078656e+002 1.247855842479270e+002 6.155502957082115e-003 5.1

22、87489853273806e-001s = 8.605579177461341e-001 3.702861735151443e+001 5.850209205959800e-012 2.062999126251862e+001 画出残差与各个变量之间的关系,发现分配比较均匀,但是置信区间仍存在包含0点现象,且R2、s2较上个模型有所增加,模型有效的概率略有降低。3、综合 通过对比各个模型,最后得出如下两个综合模型: 模型一: 通过回归分析得到:b = 6.632561316046274e+001 -7.521817398399753e+000 -7.055755884551737e+000

23、-2.829747956923546e+001 2.285037806461467e+000 2.705540937203730e-001bint = 4.500538106854981e+001 8.764584525237567e+001 -2.149970782515665e+001 6.456073028357144e+000 -9.515642732306020e+000 -4.595869036797455e+000 -3.378071979662776e+001 -2.281423934184316e+001 1.455970842770991e+000 3.1141047701

24、51943e+000 9.124210847449554e-002 4.498660789662505e-001s = 9.311296542416800e-001 8.112022473439008e+001 1.110223024625157e-016 1.018913808712425e+001 可以看到决定系数约为0.931,残差约为10.2,拒绝模型的概率达到了10的-16次方数量级,且各个参量的置信区间中仅x1包含零点,可以认为是较好的模型。 模型二: 回归分析得到:b = 8.499402636764765e+001 -1.903700514488066e+001 -6.8093

25、94676502798e+000 -6.563430598360529e+001 2.303037549296181e+001 1.792315390363582e+000 2.705540937203732e-001bint = 5.650498703443166e+001 1.134830657008636e+002 -3.718757380970865e+001 -8.864364800526623e-001 -9.183244425312040e+000 -4.435544927693555e+000 -1.056531023108610e+002 -2.561550965634957

26、e+001 -1.440223331257528e+000 4.750097431718115e+001 8.402562024954153e-001 2.744374578231748e+000 9.856901480460173e-002 4.425391726361446e-001s =9.389318009906731e-001 7.431315226377969e+001 3.330669073875470e-016 9.346382568379193e+000这个模型与书后答案所给模型一致。与之前一种相比,它有着更好的决定系数、更小的残差以及剩余方差,但是模型的有效性略低于前一种。

27、不过系数的置信区间中也出现了包含0的情况。 总体上讲第二个模型应当有一点略微的优势。程序清单1、观察clear;clc;x1=1.89,1.94,1.95,1.82,1.85,1.78,1.76,1.76,1.75,1.74,1.70,1.70,1.68,1.60,1.61,1.64,1.67,1.68;x2=6.1,6.2,6.3,8.2,9.8,10.3,10.5,8.7,7.4,6.9,5.2,4.9,4.3,3.7,3.6,3.1,1.8,2.3;y1=22.1,15.4,11.7,10.3,11.4,7.5,13,12.8,14.6,18.9,19.3,30.1,28.2,25.6,

28、37.5,36.1,39.8,44.3;y2=7.2,5.4,7.6,2.5,2.4,1.7,4.3,3.7,3.9,7.0,6.8,10.1,9.4,7.9,14.1,14.5,14.9,15.6; figure;plot3(x1,x2,y1,b*);grid on;figure;plot3(x1,x2,y2,b*);grid on;2、分立模型X=ones(length(x1),1),x1,x2;b1,bint1,r1,rint1,s1=regress(y1,X);b1,bint1,s1figure;rcoplot(r1,rint1);pause; b2,bint2,r2,rint2,s2

29、=regress(y2,X);b2,bint2,s2figure;rcoplot(r2,rint2);3、统一模型x3 = zeros(1,length(x1),ones(1,length(x2);y1=22.1,15.4,11.7,10.3,11.4,7.5,13,12.8,14.6,18.9,19.3,30.1,28.2,25.6,37.5,36.1,39.8,44.3;y2=7.2,5.4,7.6,2.5,2.4,1.7,4.3,3.7,3.9,7.0,6.8,10.1,9.4,7.9,14.1,14.5,14.9,15.6; X=ones(length(x1)+length(x2),1),x1,x1,x2,x2,x3;Y = y1,y2;b,bint,r,rint,s=regress(Y,X);b,bint,sfigure;rcoplot(r,rint);4、观察残差X=ones(length(x1)+length(x2),1),x1,x1,x2,x2,x3;Y = y1,y2;b,bint,r,rint,s=regress(Y,X); plot3(x1,x2,r(1:18,:),*);grid on;pause;plot3(x1

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2