ImageVerifierCode 换一换
格式:DOCX , 页数:12 ,大小:74.88KB ,
资源ID:7719172      下载积分:1 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bingdoc.com/d-7719172.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(统计学专业学年论文运用SAS对中国历年运动员获世界冠军数进行建模并作预报.docx)为本站会员(b****6)主动上传,冰点文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰点文库(发送邮件至service@bingdoc.com或直接QQ联系客服),我们立即给予删除!

统计学专业学年论文运用SAS对中国历年运动员获世界冠军数进行建模并作预报.docx

1、统计学专业学年论文运用SAS对中国历年运动员获世界冠军数进行建模并作预报 20112012学年09级统计学专业学年论文 题目 运用SAS对中国历年运动员获世界冠军数进行建模并作预报. 学生姓名 学 号 成绩 评语:指导教师日期运用SAS对历年中国运动员获世界冠军数进行建模并作预测摘要:本文通过选取1978年-2009年中国历年运动员获得金牌数,运用SAS统计软件进行处理分析,选取显著的系数,建立模型,对年我国2010以后运动员金牌数做出预测。关键字 SAS AR模型 参数估计 平稳时间序列1、引言 在自然现象和经济现象中,人们为了对某些事物或系统的运行规律探索其究竟,需要观测所要研究的某种现象

2、,从而得到一定顺序的数据资料。通过分析这些数据资料,对事物或系统的未来发展进行预测或控制方法,称为时间系列分析。从统计学的内容来看,研究数据的统计方法就是时间序列分析。就此足以看到时间序列分析的重要性及其应用的广泛性。时间序列的统计解释是某项统计指标按时间顺序记录的指标值数列时间序列的统计意义是某一系统程序运行过程中的不用时间点的响应,是系统行为量化数据的有序 客观记录,反映了系统的结构特征和运行规律。随机时间序列分析就是利用数学的方法描述时间序列的构成因素,具体地说就是对影响时间序列的长期趋势、季节变动、循环波动进行预订和估计;进一步的,将它们从时间序列中分离后,对剩余的一项时间序列的随机波

3、动进行分析和建模;从而实现对时间序列变化规律的认识,预测或控制未来行为。2、SAS介绍 Statisticsl Analysisi System简称SAS,可以用来分析数据和编写报告。它是美国SAS研究所的产品,在国际上被誉为标准通用软件,在我国深受医学、农林、财经、社会科学、行政管理等众多领域的专业工作者的好评。 SAS采用积木式模型结构,其中的SAS/STAT模块是目前功能最强的多元统计分析程序集,可以作回归分析、聚类分析、判别分析、主成分分析、因子分析、典型相关分析、各种实验设计的方差分析、协方差分析以及时间序列分析。3、平稳时间序列的基本概念 时间序列的统计特征函数,时间序列Xt,tZ

4、是按时间次序排列的随机变量序列。对时间序列的研究通常情况下是通过统计特征函数进行的。 1) 均值函数 如果对任意tZ,EXt存在,则称函数 Mx(t)=EXt, tZ为时间序列Xt,tZ的均值。 如果对任意tZ,EXt存在,则称Xt,tZ为二阶矩时间序列有: 2) 自协方差函数 Cx(s,t)=E(Xs-Mx(s))(Xt-Mx(t), s,tZ. 3) 方差函数 Dx(t)=EXt-Mx(t)2,tZ. 4) 自相关函数 Rx(s,t)=E(XsXt), s,tZ. 二阶矩时间序列的协方差和相关函数一定存在,且有下列关系: Cx(s,t)=Rx(s,t)-Mx(s)Mx(t) , 特别的,当

5、Xt的均值函数值 Mx(t)=0时,Cx(s,t)=Rx(s,t) . 均值函数 Mx(t)是时间序列Xt,tZ在时刻t的平均值,称为集平均。发差函数Dx(t)是时间序列在t时刻均值函数 Mx(t)的偏离程度。自协方差函数Cx(s,t)和自相关函数Rx(s,t)则反映时间序列在时刻s和t的线性相关程度。 下面介绍时间序列分析的重点对象平稳时间序列的概念。 平稳时间序列 如果一个时间序列Xt,tZ具有如下特征则称其为平稳时间序列:1) 在任意时刻tZ,Xt存在有限的方差,即Xt是一个二阶矩形时间序列; 2)在任意时刻tZ,Xt的均值函数Mx(t)=为与t无关的常数; 3)在任意时刻s,tZ,Xt

6、的自协方差函数Cx(s,t)=t-s是时间差t-s的函数,及对任意s,tZ和kZ,Cx(s,t)=Cx(s+k,t+k)=t-s 。 很明显,平稳时间序列的统计特征主要是由其协方差函数刻画的,时间序列分析理论的一个重要特点就是利用自协方差函数研究平稳时间序列的统计性质。 4、平稳性检验 平稳时间序列因为有很好的统计特征,所以便于研究。我们先检验所观测的样本是否具有平稳性,然后根据其平稳性来建立相适应的模型。平稳性检验中的以下二种方法 1)数据检验法 数据图检验是在t-Xt平面直角坐标系中将研究的试驾序列绘成连线图,观察其是否具有趋势性或周期性,若无明显的趋势性或周期性,其波动幅度也不大,就认为

7、序列是平稳的。 2)自相关函数检验法 一个零均值平稳序列的自相关函数要么是结尾的,要么是拖尾的。因此,如果一个时间序列零均值化以后的自相关函数出现了缓慢衰减或周期性的衰减的情况,则说明序列可能存在某种趋势或周期性。5、白噪声序列 如果序列彼此之间没有任何相依性,那就意味着该序列是一个没有记忆的序列,过去的行为对将来的发展没有丝毫影响,这种序列称为纯随机序列,也称为白噪声序列。白噪声序列需要满足如下性质: 任取tt,有EXt=; 任取t,sT ,有 。表一 历年中国运动员获金牌数年份19781979198019811982198319841985金牌数41232513393746年份198619

8、87198819891990199119921993金牌数26695482549389103年份19941995199619971998199920002001金牌数791027592839211090年份20022003200420052006200720082009金牌数110841011061411231201426.SAS分析及模型建立根据上表,运用如下SAS程序得到时序图。输入: data example2;input x ; t=intnx(year,01jan1978d,_n_-1);format t year4.; cards; 0.076118 0.088274 0.1200

9、92 0.208865 0.250815 0.139663 0.173564 0.247475 0.129597 0.098603 0.166795 0.236072 0.312381 0.36407 0.261335 0.170789 0.109536 0.068749 0.062496 0.106354 0.105232 0.097373 0.128727 0.177109 0.156739 0.169663 0.228815 0.181464 0.085521 0.176881;proc gplot; plot x*t; symbol i=jion v=dot; run; 图一从上图可以

10、看出存在奇异点。再输入程序: data example2;input x ;t=intnx(year,01jan1980d,_n_-1);format t year4.;cards; 0.076118 0.088274 0.120092 0.208865 0.250815 0.139663 0.173564 0.247475 0.129597 0.098603 0.166795 0.236072 0.312381 0.36407 0.261335 0.170789 0.109536 0.068749 0.062496 0.106354 0.105232 0.097373 0.128727 0.

11、177109 0.156739 0.169663 0.228815 0.181464 0.085521 0.176881;proc gplot; plot x*t; symbol i=jion v=dot; proc means; var x; run;得到 N 均值 标准差 最小值 最大值 - 30 0.1633056 0.0744381 0.0624960 0.3640700 - 因为均值为0.1633056, 标准差为0.0744381.根据置信区间公式(均值2*标准差,均值+2*标准差)得到置信区间 (0.014429, 0.312182)。显然,0.312381,0.36407 (0

12、.014429, 0.312182),所以,0.312381,0.36407为奇异值。将其修正2*0.2360720.1633056=0.3088384.将修正后的数据再进行时序分析。由SAS输入:data example2;input x ;t=intnx(year,01jan1978d,_n_-1);format t year4.;cards; 0.076118 0.088274 0.120092 0.208865 0.250815 0.139663 0.173564 0.247475 0.129597 0.098603 0.166795 0.236072 0.3088384 0.3088

13、384 0.261335 0.170789 0.109536 0.068749 0.062496 0.106354 0.105232 0.097373 0.128727 0.177109 0.156739 0.169663 0.228815 0.181464 0.085521 0.176881;proc arima;identify var=x nlag=12 minic p=(0:5) q=(0:5);run;得到图2图2 AutocorrelationsLag Covariance Correlation -1 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 1

14、 Std Error0 0.0046802 1.00000 | |*| 01 0.0028140 0.60127 | . |* | 0.1825742 0.00070800 0.15128 | . |* . | 0.2396563 -0.0001373 -.02933 | . *| . | 0.2428184 -0.0010769 -.23011 | . *| . | 0.2429365 -0.0015647 -.33432 | . *| . | 0.2500966 -0.0012545 -.26804 | . *| . | 0.2645737 -0.0006004 -.12828 | . *

15、| . | 0.2734758 -0.0000138 -.00295 | . | . | 0.2754749 0.00007075 0.01512 | . | . | 0.27547510 -0.0001650 -.03526 | . *| . | 0.27550311 -0.0005373 -.11480 | . *| . | 0.27565312 -0.0006276 -.13409 | . *| . | 0.277242 . marks two standard errors Partial AutocorrelationsLag Correlation -1 9 8 7 6 5 4 3

16、 2 1 0 1 2 3 4 5 6 7 8 9 1 1 0.60127 | . |* | 2 -0.32929 | *| . | 3 0.08389 | . |* . | 4 -0.34735 | *| . | 5 -0.00058 | . | . | 6 -0.08261 | . *| . | 7 0.06692 | . |* . | 8 -0.02765 | . *| . | 9 -0.11784 | . *| . | 10 -0.10132 | . *| . |11 -0.16195 | . *| . | 12 0.02434 | . | . | 修正后的自相关函数和偏自相关函数对数据

17、进行平稳性检验由SAS输入:data example2;input x ;t=intnx(year,01jan1978d,_n_-1);format t year4.;cards; 0.076118 0.088274 0.120092 0.208865 0.250815 0.139663 0.173564 0.247475 0.129597 0.098603 0.166795 0.236072 0.3088384 0.3088384 0.261335 0.170789 0.109536 0.068749 0.062496 0.106354 0.105232 0.097373 0.128727

18、0.177109 0.156739 0.169663 0.228815 0.181464 0.085521 0.176881;proc gplot;symbol i=joint v=none;plot x*t;run;得到图3图3由以上图形可以看出金牌数修正后的数据是平稳的。根据图4可以考虑建立AR(5)模型。 图4 Minimum Information CriterionLags MA 0 MA 1 MA 2 MA 3 MA 4 MA 5AR 0 -5.63808 -6.33592 -6.22679 -6.19669 -6.38506 -7.12205AR 1 -6.27622 -6.33

19、676 -6.43043 -6.41702 -6.68033 -7.24621AR 2 -6.49859 -6.38843 -6.38887 -6.38811 -6.58229 -7.24494AR 3 -6.42686 -6.32627 -6.46201 -6.3864 -6.55773 -7.29697AR 4 -7.31525 -7.22557 -7.14565 -7.21716 -7.58271 -7.50121AR 5 -7.23622 -7.12611 -7.03709 -7.14579 -7.5927 -7.76424 Error series model: AR(9) Mini

20、mum Table Value: BIC(5,5) = -7.76424由SAS输入:data example2;input x ;t=intnx(year,01jan1978d,_n_-1);format t year4.;cards; 0.076118 0.088274 0.120092 0.208865 0.250815 0.139663 0.173564 0.247475 0.129597 0.098603 0.166795 0.236072 0.3088384 0.3088384 0.261335 0.170789 0.109536 0.068749 0.062496 0.10635

21、4 0.105232 0.097373 0.128727 0.177109 0.156739 0.169663 0.228815 0.181464 0.085521 0.176881;proc arima;identify var=x nlag=12 minic p=(0:5) q=(0:5);estimate p=5;run;运行后得到图5图5 Conditional Least Squares Estimation Standard Approx Parameter Estimate Error t Value Pr |t| Lag MU 0.15311 0.01673 9.15 .000

22、1 0 AR1,1 1.01641 0.21597 4.71 .0001 1 AR1,2 -0.81721 0.29979 -2.73 0.0118 2 AR1,3 0.71011 0.32900 2.16 0.0411 3 AR1,4 -0.57931 0.31352 -1.85 0.0770 4 AR1,5 0.11099 0.22942 0.48 0.6329 5 参数估计及检验由上图,我们可以看到-0.817210.05 , -0.5792131 |t| LagMU 0.16058 0.01204 13.34 Lag Square DF ChiSq -Autocorrelations-

23、6 10.23 3 0.0167 0.470 -0.049 0.016 0.037 -0.156 -0.21512 13.57 9 0.1384 -0.116 -0.011 -0.029 -0.127 -0.168 -0.10118 15.91 15 0.3879 -0.098 -0.128 -0.015 0.013 -0.097 -0.03524 20.86 21 0.4678 0.159 0.097 -0.035 0.069 0.080 -0.040 AP(5)模型的残差白噪声检验 图7表明AR(5)模型拟合得非常好,我们利用此模型做预报。接着输入:data example2;input

24、x ;t=intnx(year,01jan1980d,_n_-1);format t year4.;cards; 0.076118 0.088274 0.120092 0.208865 0.250815 0.139663 0.173564 0.247475 0.129597 0.098603 0.166795 0.236072 0.3088384 0.3088384 0.261335 0.170789 0.109536 0.068749 0.062496 0.106354 0.105232 0.097373 0.128727 0.177109 0.156739 0.169663 0.22881

25、5 0.181464 0.085521 0.176881;proc arima;identify var=x nlag=12 minic p=(0:5) q=(0:5);estimate p=(2,3,4);forecast lead=5 id=t out=results;proc gplot data=results;plot x*t=1 forecast*t=2 l95*t=3 u95*t=3/overlay;symbol1 c=blue i=none v=star;symbol2 c=red i=join v=none l=1 w=1;symbol3 c=green i=jion v=n

26、one l=2 w=2;run;得到图8 图8 Forecasts for variable xObs Forecast Std Error 95% Confidence Limits10 0.1258 0.0697 -0.0108 147.824111 0.1523 0.0697 0.0158 172.4855 12 0.1795 0.0709 0.0407 169.170113 0.1517 0.0710 0.0126 187.360714 0.1749 0.0738 0.0302 186.5737 由图9可以看出,原始数据绝大部分都在预测值内,且近期的数据离预报曲线越近,表明模型建立的比较合理,预报效果比较精准。图9 预报区域图结论:由上表可以看出,2010年金牌数保持在15%上下浮动,并且2010金牌数为147,实际我108,相差不大。 参考文献1 George E.P.Box, Gwily M. Jenikins, Gregoey C. Reinsel 著;顾岚译。时间序列分析预测与控制(第三版)。北京:中国统计出版社,1997.2 王振龙。时间序列分析。北京:中国统计出版社,1999。3 王燕。应用时间序列。北京:中国人名出版社,2005.4 阮桂海等著。SAS统计分析大全。北京:清华大学,2003.

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2