ImageVerifierCode 换一换
格式:DOCX , 页数:26 ,大小:137.85KB ,
资源ID:3098158      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bingdoc.com/d-3098158.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(Unit42StatWord文件下载.docx)为本站会员(b****1)主动上传,冰点文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰点文库(发送邮件至service@bingdoc.com或直接QQ联系客服),我们立即给予删除!

Unit42StatWord文件下载.docx

1、(42.3)式中,即阶差分后序列等于原来序列的若干序列值的某种加权和。特别当模型中的参数、取一些特殊值时,可以转换成一些常见模型,例如,当时,就是模型;当时,为时,模型为,被称为随机游走模型,或称醉汉模型,是有效市场理论的核心,常应用于投机价格走势的模拟。2. ARIMA模型的建模步骤Box和Jenkins描述了建立ARIMA模型的三个阶段:识别阶段、估计阶段和预测阶段。如图42.1所示。(1) 识别阶段使用identify语句来指定响应变量序列并且识别候选ARIMA模型。identify语句读入后面语句中用到的时间序列,一般先对序列进行非线性、差分和平稳性检验,可能对序列进行差分,然后计算自

2、相关系数ACF、逆自相关系数IACF、偏自相关系数PACF和互相关系数。此阶段的输出通常会建议一个或多个可拟合的ARIMA模型。如果模型确定,还可以检验样本自相关系数SACF和样本偏自相关系数SPACF,以分出模型的类型。(2) 估计阶段使用estimate语句来指定ARIMA模型去拟合在前面identify语句中指定的响应变量,并且估计该模型的参数。estimate语句也生成诊断统计量从而帮助判断该模型的适用性。关于参数估计值的显著性检验可以指出模型里的一些项是否不需要。拟合优度统计量可帮助比较该模型和其他模型的优劣。关于白噪声残差检验可指明残差序列是否包含可被其他更复杂模型采用的额外信息。

3、如果诊断检验表明模型不适用,则可尝试另一个模型然后重复估计和诊断。(3) 预测阶段使用forecast语句来预测时间序列的未来值,并对这些来自前面estimate语句生成的ARIMA模型的预测值产生置信区间。图42.1 Box-Jenkins法建模过程示意图2、 ARIMA过程SAS/ETS软件中的ARIMA过程是集一元时间序列模型判定、参数估计和预测为一体的多功能综合工具。它是采用Box-Jenkins方法建立ARIMA模型。当ARIMA模型包括其他时间序列作为输入变量时,该模型有时也被称为ARIMAX模型。ARIMA模型还支持干预或中断时间序列模型,误差的多元回归分析,任意复杂程度的有理转

4、移函数模型。ARIMA模型有三个参数(p,d,q),这里p指模型的自回归部分的阶数,d指序列差分的次数,q指模型平均移动部分的次数。该过程通常分三个阶段进行:首先识别序列,然后估计和诊断检验模型,最后进行预测。ARIMA过程一般由下列语句控制:proc arima data=时间序列数据集 out=输出预测值数据集;where 条件表达式;identify var=变量() ;estimate ;forecast run ;where语句的作用是指定用于分析的时间间隔,通常条件表达式是有关日期的条件表达式,例如,31dec98dday31dec99d,其中day是输入数据集中的日期变量。1.

5、identify语句中的指定了构造模型的时间序列变量,可以将identify语句缩写为i。identify语句主要完成时间序列的差分计算、样本ACF、IACF和PACF函数的计算、卡方检验统计量和白噪声自相关检验的p值的计算。它的主要选项有: var=变量(d1,d2,dk)指明含有要分析的时间序列的变量名,按括号内列出的差分周期列表来计算时间序列的滞后差分,是必选项。例如,var=X(1)为对滞后1项的序列差分,即XtXt-1。var=X(2)为对滞后2项的序列差分,即XtXt-2。var=X(1,1)为X进行二阶差分,即(XtXt-1)(Xt-1Xt-2)。 nlag=数字指明计算自相关的

6、滞后数,其值应大于p+d+q,小于观测数,默认值为24。 noprint不输出结果。 crosscorr=(干预变量(d1)列出有var=指定的响应序列的交叉相关变量。干预变量在交叉相关变量中。交叉相关变量的差分由圆括号内的差分滞后确定。2. estimate语句中的该语句对已执行的identify语句中的响应变量规定一个模型,可以缩写为e。定义模型的主要选项有: p=(p1,p2,)(p1,p2,)定义一个在p中指定的滞后处具有自回归参数的模型,p的默认值为0。 q=(q1,q2,)(q1,q2,)定义一个在q中指定的滞后处具有滑动平均参数的模型,q的默认值为0。如果p=和q=都没有指定,则

7、拟合随机模型。 noconstant在模型中舍弃常数项。 noint在该模型中不拟合截距参数。 method=ml/uls/cls指定估计时使用的方法。ml为极大似然估计方法,uls为无条件最小二乘法,cls为有条件最小二乘法。默认值为cls。 outest=数据集名将参数估计值输出到指定的数据集。 outmode=数据集名将模型和参数估计值输出到指定的数据集。 outstat=数据集名将模型诊断统计量输出到指定的数据集。 plot可以绘制残差自回归函数等。3. forecast语句中的该语句利用estimate语句所产生的参数估计生成时间序列的预测值。可以缩写为f。主要选项有: alpha=

8、设置预测置信限的大小。上下置信限的置信水平为1。的默认值为5%。 lead=n指定要计算的多步向前预测值的次数。默认值为24。 back=n指定在数据末尾前n个观测值开始进行分步预测。默认值为0。 interval=时间间隔指定观测之间的时间间隔。常用的时间间隔为year(年)、qtr(季)、month(月)、week(周)、weekday(工作日)、day(天)、hour(小时)、minute(分)和second(秒)。 id=变量名指明输入数据集中一个变量,用于识别与观测有关的时间周期。 noprint取消打印输出。 out=数据集名将预测值和其他值输出到一个指定的数据集中。data步中的

9、rename选项可用来重新命名预测值和上下置信限的变量名。3、 实例分析例42.1 建立国际航线旅客月度人数的ARIMA模型。我们已有一组1949年至1961年国际航线旅客月度人数的144条记录。使用ARIMA过程进行建模和预测。其数据列于表42.1。 表42.1 1949年至1961年国际航线旅客月度人数YEAR1234567891011121949112118132129121135148136119104195011512614112514917015813311414019511451501781631721991841621461661952171180193181183218230

10、242209191194195319623623522924326427223721120119542041882272343022932592031955233267269270315364347312274278195628427731731331837441340535530627119573013563484224654674043053361958340362363435491505359310337195936034240639642047254855946340719604173914194615356226064083904321. 建立数据集和绘制原始时间序列图首先,输入要分

11、析的时间序列的数据,建立SAS数据集。为了识别时间序列的数据是否平稳和是否明显有季节性,通常先制作时间序列图来观察分析,程序如下:goptions reset=global gunit=pct cback=white border htitle=6 htext=3 ftext=swissb colors=(black);data arimad01;date=intnx(month,31dec1948d,_n_);input x ;cards; 112 118 132 129 121 135 148 148 136 119 104 118 115 126 141 135 125 149 170

12、170 158 133 114 140 417 391 419 461 472 535 622 606 408 461 390 432proc print data=arimad01 ;proc gplot data=arimad01 ;plot x*date /vaxis=axis1 haxis=axis2 href=31dec1949d to 1jan61d by year;symbol1 i=join v=c h=2.5 l=1 font=swissb;axis1 label=(Passenger) order=(100 to 650 by 50);axis2 label=(Month)

13、 order=(1jan49d by year);format date monyy. ;title1 Time Serial Chartrun;2. 对平稳性和季节性的识别对平稳性和季节性的识别通常有直接估计和利用proc arima中identify语句两种方法,或两者结合起来一起判断。 直接估计平稳性。直接估计就是通过直接观察时间序列折线图来检验序列是否平稳。如果时间序列有某种趋势或呈现出增加或减少范围的扩散现象,则序列是不平稳的。 利用proc arima估计平稳性。如果序列的折线图并不明显地呈现上述现象,而我们又无法直接判断序列究竟平稳与否,通常可以利用proc arima过程的id

14、entify语句来检测序列是否平稳。程序如下:proc arima data=arimad01;identify var=x;提交程序运行后,部分结果如表42.2所示。表42.2 原始序列x的自相关图 ARIMA Procedure Name of variable = X. Mean of working series = 279.6042 Standard deviation = 118.5103 Number of observations = 144 Autocorrelations Lag Covariance Correlation -1 9 8 7 6 5 4 3 2 1 0 1

15、 2 3 4 5 6 7 8 9 1 Std 0 14044.684 1.00000 | |*| 0 1 13197.393 0.93967 | . |* | 0.083333 2 12200.063 0.86866 | . |* | 0.138593 3 11246.527 0.80077 | . |* | 0.172303 4 10623.172 0.75638 | . |* | 0.196454 5 10074.684 0.71733 | . |* | 0.215732 6 9645.037 0.68674 | . |* | 0.231705 7 9394.781 0.66892 | .

16、 |* | 0.245433 8 9272.192 0.66019 | . |* | 0.257782 9 9499.554 0.67638 | . |* | 0.269268 10 9983.600 0.71085 | . |* | 0.280819 11 10531.777 0.74988 | . |* | 0.293049 12 10738.185 0.76457 | . |* | 0.306084 13 9989.496 0.71127 | . |* | 0.319071 14 9049.658 0.64435 | . |* | 0.329898 15 8238.988 0.58663

17、 | . |* . | 0.338525 16 7589.355 0.54037 | . |* . | 0.345512 17 7059.360 0.50264 | . |* . | 0.351332 18 6608.510 0.47053 | . |* . | 0.356291 19 6382.964 0.45448 | . |* . | 0.360581 20 6252.527 0.44519 | . |* . | 0.364537 21 6491.410 0.46220 | . |* . | 0.368293 22 6871.251 0.48924 | . |* . | 0.372299

18、 23 7332.870 0.52211 | . |* . | 0.376738 24 7517.186 0.53523 | . |* . | 0.381729 . marks two standard errors观察在表42.2中程序输出的有关时间序列变量x的自相关系数ACF和ACF图,发现自相关系数长期位于零轴正的一边,这是具有单调递增趋势序列的典型特征,同时自相关图呈现出明显的正弦波动规律,这是具有周期变化规律的非平稳序列的典型特征。自相关图显示出来的这两个性质和该序列时序图显示出的带长期递增趋势的周期性质是非常吻合的。一般来说,如果ACF缓慢地向零趋近,而几个时滞的ACF却相当大,那

19、么序列也许不平稳。对于不同的时间序列类型,它们相应ACF的特性有: 若时间序列是随机无趋势的,所有时滞的自相关系数都等于0。 若时间序列是上升或下降趋势的,那么对于短时滞来说,自相关系数大且为正,而且随着时滞lag的增加而缓慢地下降。ACF本身似乎随着时滞长度的增加而呈下降趋势。 若时间序列无趋势但具有季节性,那么对于按月(L=12)采集的数据来说,时滞12,24,的自相关系数达到最大(即nL处),而随着时滞长度增加时,变得较小。 若时间序列有趋势且具有季节性,那么自相关系数特性类同于有趋势序列,但是它们是摆动的,对于按月的数据,在时滞12,24等处具有峰态。 若时间序列是平稳的,它具有正自相

20、关的误差项,那么低阶的自相关系数较大,但是随着时滞长度的增加而迅速地衰减。另外,在ACF图中,通过自相关系数值的图示是否在零点附近的两条对称的虚线之内,完成不同时滞的总体自相关系数为0的检验。3. 变换不平稳序列为平稳序列如果断定一个时间序列是不平稳的,通常可以作一些简单的变换或修正,使其减少趋势或平稳化。然后对变换后的新序列建模预测,可以避免将数据拟合成更复杂的模型。最常用的变换方法有: 如果时间序列呈线性趋势,均值不是常数,利用一阶差分将产生一个平稳序列。 如果时间序列呈二次趋势,均值不是常数,利用二阶差分将产生一个平稳序列。 如果时间序列呈现出随时间的上升或下降而偏差、方差不是常数,通常

21、可利用取自然对数转化为平稳序列。 如果时间序列呈现指数趋势,均值和方差都不是常数,通常也可利用取自然对数转化为平稳序列。 如果时间序列呈现“相对环”趋势,通常将数据除以同时发生的时间序列的相应值转化为平稳序列。(1) 取对数消除振幅变大趋势从原始时间序列的折线图中观察发现,该序列具有季节性变化同时有增大的趋势,而且季节变化的振幅越来越大,再观察ACF图和自相关系数也得到相同的结论。因此,我们可以对这批数据取对数来先消除增幅越来越大的现象。另外,数据呈现每隔12个时间单位为一个周期的季节性。为了便于比较,我们将原始时间序列和消除增幅后的时间序列按12个时间单位的间隔绘制在一张图表上。data a

22、rimad02;set arimad01 ;xlog=log(x);proc print data=arimad02;proc gplot data=arimad02 ;plot xlog*date / vaxis=axis1 haxis=axis2 href=plot2 x*date /vaxis=axis3 vref=100;symbol1 i=join v=c h=3 l=1 r=1 font=swissb c=green;symbol2 i=join v=c h=3 l=1 r=1 font=swissb c=blue; axis1 label=(Log) order=(4.5 to

23、6.5 by 0.2) offset=(0,45);12 Monthaxis3 label=() order=(100 to 650 by 50) offset=(23,0);Time Serial Log Chart提交程序运行后,结果如图42.2所示。图42.2 对原始数据序列取对数以消除变大的季节震幅(2) 取两次差分消除季节增长趋势从图42.2中可见,对原始时间序列取对数变换后的新序列,明显呈现季节性的增长的趋势,仔细分析每12个单位的周期后发现还有增长趋势。所以,需要对这个新序列数据再进行滞后一次和滞后12次共两次差分,最终转换为平稳序列。同样为了便于比较,我们仍然在一张图上绘制转换前的时间序列和转换后的最终的平稳时间序列。data arimad03;set arimad02;dif12=dif1(xlog)-(lag1(xlog)-lag12(xlog);

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2