回归分析在数理统计中的应用实例论文.doc

上传人:聆听****声音 文档编号:507385 上传时间:2023-04-29 格式:DOC 页数:11 大小:315.50KB
下载 相关 举报
回归分析在数理统计中的应用实例论文.doc_第1页
第1页 / 共11页
回归分析在数理统计中的应用实例论文.doc_第2页
第2页 / 共11页
回归分析在数理统计中的应用实例论文.doc_第3页
第3页 / 共11页
回归分析在数理统计中的应用实例论文.doc_第4页
第4页 / 共11页
回归分析在数理统计中的应用实例论文.doc_第5页
第5页 / 共11页
回归分析在数理统计中的应用实例论文.doc_第6页
第6页 / 共11页
回归分析在数理统计中的应用实例论文.doc_第7页
第7页 / 共11页
回归分析在数理统计中的应用实例论文.doc_第8页
第8页 / 共11页
回归分析在数理统计中的应用实例论文.doc_第9页
第9页 / 共11页
回归分析在数理统计中的应用实例论文.doc_第10页
第10页 / 共11页
回归分析在数理统计中的应用实例论文.doc_第11页
第11页 / 共11页
亲,该文档总共11页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

回归分析在数理统计中的应用实例论文.doc

《回归分析在数理统计中的应用实例论文.doc》由会员分享,可在线阅读,更多相关《回归分析在数理统计中的应用实例论文.doc(11页珍藏版)》请在冰点文库上搜索。

回归分析在数理统计中的应用实例论文.doc

福建农林大学计算机与信息学院

(数学类课程)

课程论文报告

课程名称:

概率论与数理统计教程

实习题目:

回归分析在数理统计中的应用实例

姓名:

系:

应用数学

专业:

数学与应用数学

年级:

2009级

学号:

指导教师:

职称:

副教授

2011年6月25日

福建农林大学计算机与信息学院数学类

课程论文报告结果评定

评语:

成绩:

指导教师签字:

评定日期:

1

目录

摘要 ……………………………………………………………………………………………..2

1、问题的提出……......………………………...………………………………………………3

2、 问题的分析 3

3、 问题的解决 3

3.1问题重述 3

3.2建立模型 3

3.3模型求解 4

3.4模型检验 6

4、 小结 8

参考文献 8

附录 ………………………………………………………………………………………………9

10

回归分析在数理统计中的应用实例

摘要:

回归分析是数理统计中重要的一种数据统计分析的思想。

它是研究一个随机变量与一个或多个普通变量之间的相互关系的统计方法。

主要是解决从一组数据出发,确立变量间是否存在相关的关系,如果存在相关关系,确定他们之间合适的数学表达式即经验公式或回归方程,并对它的可信度作统计检验;还可以针对从共同影响一个变量的许多变量中,判断哪些变量的影响是显著的,哪些变量是不显著的,并利用所确定的回归方程进行预测和控制。

本文就是针对实际问题运用回归分析中一元线性回归分析的统计方法,来确定自变量与另一个变量的相关关系,并确立出较为合理的回归方程,再对其的可信度进行统计检验。

关键词:

回归分析;回归方程;检验法

回归分析在数理统计中的应用实例

1、问题的提出

根据以下9组关于营业税税收总额和社会商品零售总额的数据[1],确定出两者的关系。

表1社会商品零售总额和营业税税收总额

序号

社会商品零售总额

营业税税收总额

1

142.08

3.93

2

177.30

5.96

3

204.68

7.85

4

242.68

9.82

5

316.24

12.50

6

341.99

15.55

7

332.69

15.79

8

389.29

16.39

9

453.40

18.45

2、问题的分析

营业税税收总额是受很多的因素所决定,但是题目中已经将主要的因素确定为社会商品零售总额,这就大大的减少了在对于自变量的多因素进行分析的过程,从而减少了在计算以及统计上的困难,但是这也在很大的程度上减少了结果的实际意义。

在针对本题所给的两个变量之间的关系,作出回归分析以及运用重要的数学软件的实现,从而来确定这两个变量之间的关系,并计算出两者之间的回归方程,再对方程的可信度进行检验。

3、问题的解决

3.1问题重述

在本题目中已经明确地给出只有两个变量之间的关系,所有可以忽略影响营业税税收总额除社会商品零售总额之外的其他因素,这对于解决问题减少了难度。

只要在运用回归分析的统计方法来比较二者之间的关系以及它们之间的相关性,并运用经验的回归公式,计算出二者之间的数学关系式。

3.2建立模型

根据表中所给的数据初步作出营业税税收总额和社会商品零售总额之间的数据散点图,并在散点图中找出关于二者之间的初步关系。

运用数学软件来作出二者的散点图如下:

(MATLAB程序代码如附录一)

从散点图中可以看出,这9个点分布在一条直线的附近,从而可以初步认为和的关系基本上是线性的,而这些点与直线的偏离是由其他一切随机因素影响而成的。

因此可以假设表1中的数据有以下的关系式:

(3-1)

其中表示随的变化而线性变化的部分,是一切随机因素影响的总和,有时也称随机误差,它是不可观测其值的随机变量,并假定其数学期望,方差,并且服从正态分布。

可以是随机变量也可以是一般变量。

而在以下的讨论中,都假定社会商品零售总额是一般变量,即它是可以精确测量或严格控制的。

由式子(3-1)可知营业税税收总额是一个随机变量,但其值是可以观测的,其数学期望是社会商品零售总额的线性函数

(3-2)

这即是营业税税收总额与社会商品零售总额的相关关系形式。

对表1的几组数据观测值,由式子(3-1)可得

(3-3)

各是相互独立;,并且将式子(3-3)称为一元线性回归模型。

3.3模型求解

建立一元线性模型(3-3)后的首要任务就是根据所给数据求出从而确立二个变量之间的关系。

而通常采用最小二乘估计求模型(3-3)中的的值。

(3-4)

应满足

(3-5)

称这样得到的称为的最小二乘估计[2]。

由于,且对的导数存在,因此最小二乘法估计可以通过求偏导数并令其为零而得到:

(3-6)

这组方程称为正规方程组,经过整理可得

(3-7)

则有式子(3-7)得

(3-8)

这就是求模型(3-3)的最小二乘估计方法。

则可以运用以上的模型将表1的数据进行统计计算,利用数学软件算出可得关系如下:

(程序代码见附录二)

(3-9)

将这个回归方程的图像图与散点图进行比较,并进行分析。

画出二者的图如下:

(程序代见附录三)

可以从图中看出表中的9个数据都比较稳定在落在直线的附近,从而可以初步的认为模型(3-3)所确立而得到的回归方程是有意义的,但是还是要通过科学的检验方法来检验它的可信度。

3.4模型检验

建立经验回归方程的目的在于揭示两个相关变量与之间的内在的关系,然而对于任意样本的观测值作出的散点图,即使一眼可以看出与之间根本不存在线性关系,也可以通过式子(3-8)求出回归方程,但此时的回归方程是毫无意义的。

所以必须有一种方法去检验回归方程的可信度,在统计中称为回归显著检验[3],如果,当越大,随着的变化明显;当越小,随着的变化趋势不明显;特别当=0,,就意味着与没有线性关系。

实质上就是要对假设进行检验。

为了寻找合适的统计量,对关系式进行分解,并称为总的偏差平方和,它反映的离散程度,由于

==(3-10)

(3-11)

(3-12)

从而得

(3-13)

所以若回归方程有意义,即引起波动主要是由变化而引起的,其他因素是次要的。

即要求尽可能大,尽可能小。

为此,在此基础上建立检验,其主要思想如下:

在为真时,有

(3-14)

当不为真时,有变大的趋势,因而也有变大的趋势,故应当取单向拒绝域。

对给定的显著水平,当时,认为不真,我们称方程是显著的,反之方程是不显著的,这种用检验对回归方程作显著性检验的方法也称为方差分析。

其检验过程可以由一张“方差分析表”来进行。

见表2.

表2方差分析表

方差来源

偏差平方和

自由度

方差

显著性

回归

1

剩余

总和

所以运用以上的检验方法来检验回归方程(3-9)的可信度,具体可以运用回归分析中的方差分析程序来实现方差分析表的确立。

实现的结果如下:

建立回归数据分析变量之间的.txt文件,在利用回归分析程序包来作出如下的回归分析的方差分析表。

经过回归分析的方差分析表的结果,可以看出这个回归方程所确定营业税税收总额和社会商品零售总额的关系是符合线性关系的。

4、小结

本文主要针对实际问题运用了数理统计中的回归分析的知识去解决。

对于营业税税收总额和社会商品零售总额的关系能较为准确的表达式,这对实际有很大的应用,此外还对于预测营业税税收总额有很大的作用。

另一方面,在实验的过程中,对于我的理论的实践运用有很大的作用,同时也会给自身带来在实践中的经验。

但是在实验的过程中,还是存在着一些问题,如回归方法的确定等。

经过这次课程论文的研究中,让我更加明白了数理统计中回归分析对于实际问题的应用于解决,同时也让我明白自己在某些方面还存在着不足,还需要在以后的学习中强化自己的理论知识以及实践能力。

参考文献

[1]:

茆诗松,程依明,濮晓龙著.概率论与数理统计教程.北京:

高等教育出版社,2010.第413页.

[2]:

茆诗松,程依明,濮晓龙著.概率论与数理统计教程.北京:

高等教育出版社,2010.第397至398页.

[3]:

王岩,隋思莲,王爱青著.数理统计与MATLAB工程数据分析.北京:

清华大学出版社,2007.7.

附录

附录一

%给出向量x和y,利用下面的程序代码可以绘制散点图

x=[142.08177.30204.68242.68316.24341.99332.69389.29453.40];

y=[3.935.967.859.8212.5015.5515.7916.3918.45];

plot(x,y,'*')

xlabel('社会商品零售总额x')

ylabel('营业税税收总额y')

附录二

%给出向量x和y,利用下面的程序代码可以求出回归系数

x=[142.08177.30204.68242.68316.24341.99332.69389.29453.40];

y=[3.935.967.859.8212.5015.5515.7916.3918.45];

xp=sum(x,2)/9;

yp=sum(y,2)/9;

lxy=sum(x.*y,2)-9*xp*yp;

lxx=sum(x.*x,2)-9*xp*xp;

beta1=lxy/lxx

beta0=yp-beta1*xp

附录三

%作出散点图与回归方程直线的图像比较

x=[142.08177.30204.68242.68316.24341.99332.69389.29453.40];

y=[3.935.967.859.8212.5015.5515.7916.3918.45];

plot(x,y,'*')

xlabel('社会商品零售总额x')

ylabel('营业税税收总额y')

holdon,

x=100:

500;

y=0.0487*x-2.2582;

plot(x,y);

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > IT计算机 > 电脑基础知识

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2