时间序列模型的建立与预测.doc
《时间序列模型的建立与预测.doc》由会员分享,可在线阅读,更多相关《时间序列模型的建立与预测.doc(7页珍藏版)》请在冰点文库上搜索。
第六节时间序列模型的建立与预测
ARIMA过程yt用
F(L)(Δdyt)=a+Q(L)ut
表示,其中F(L)和Q(L)分别是p,q阶的以L为变数的多项式,它们的根都在单位圆之外。
a为Δdyt过程的漂移项,Δdyt表示对yt进行d次差分之后可以表达为一个平稳的可逆的ARMA过程。
这是随机过程的一般表达式。
它既包括了AR,MA和ARMA过程,也包括了单整的AR,MA和ARMA过程。
一.识别
用相关图和偏相关图识别模型
形式(确定参数d,p,q)
二.估计
对初步选取的模型进行参数估计
三.诊断与检验
包括参数的显著性检验和
残差的随机性检验
不可取
模型可取吗
可取
止
图建立时间序列模型程序图
建立时间序列模型通常包括三个步骤。
(1)模型的识别,
(2)模型参数的估计,(3)诊断与检验。
模型的识别就是通过对相关图的分析,初步确定适合于给定样本的ARIMA模型形式,即确定d,p,q的取值。
模型参数估计就是待初步确定模型形式后对模型参数进行估计。
样本容量应该50以上。
诊断与检验就是以样本为基础检验拟合的模型,以求发现某些不妥之处。
如果模型的某些参数估计值不能通过显著性检验,或者残差序列不能近似为一个白噪声过程,应返回第一步再次对模型进行识别。
如果上述两个问题都不存在,就可接受所建立的模型。
建摸过程用上图表示。
下面对建摸过程做详细论述。
1、模型的识别
模型的识别主要依赖于对相关图与偏相关图的分析。
在对经济时间序列进行分析之前,首先应对样本数据取对数,目的是消除数据中可能存在的异方差,然后分析其相关图。
识别的第1步是判断随机过程是否平稳。
由前面知识可知,如果一个随机过程是平稳的,其特征方程的根都应在单位圆之外;如果F(L)=0的根接近单位圆,自相关函数将衰减的很慢。
所以在分析相关图时,如果发现其衰减很慢,即可认为该时间序列是非平稳的。
这时应对该时间序列进行差分,同时分析差分序列的相关图以判断差分序列的平稳性,直至得到一个平稳的序列。
对于经济时间序列,差分次数d通常只取0,1或2。
实际中也要防止过度差分。
一般来说平稳序列差分得到的仍然是平稳序列,但当差分次数过多时存在两个缺点,
(1)序列的样本容量减小;
(2)方差变大;所以建模过程中要防止差分过度。
对于一个序列,差分后若数据的极差变大,说明差分过度。
第2步是在平稳时间序列基础上识别ARMA模型阶数p,q。
表1给出了不同ARMA模型的自相关函数和偏自相关函数。
当然一个过程的自相关函数和偏自相关函数通常是未知的。
用样本得到的只是估计的自相关函数和偏自相关函数,即相关图和偏相关图。
建立ARMA模型,时间序列的相关图与偏相关图可为识别模型参数p,q提供信息。
相关图和偏相关图(估计的自相关系数和偏自相关系数)通常比真实的自相关系数和偏自相关系数的方差要大,并表现为更高的自相关。
实际中相关图,偏相关图的特征不会像自相关函数与偏自相关函数那样“规范”,所以应该善于从相关图,偏相关图中识别出模型的真实参数p,q。
另外,估计的模型形式不是唯一的,所以在模型识别阶段应多选择几种模型形式,以供进一步选择。
表1ARIMA过程与其自相关函数偏自相关函数特征
模型
自相关函数特征
偏自相关函数特征
ARIMA(1,1,1)
Dxt=f1Dxt-1+ut+q1ut-1
缓慢地线性衰减
AR
(1)
xt=f1xt-1+ut
若f1>0,平滑地指数衰减
若f1<0,正负交替地指数衰减
若f11>0,k=1时有正峰值然后截尾
若f11<0,k=1时有负峰值然后截尾
MA
(1)
xt=ut+q1ut-1
若q1>0,k=1时有正峰值然后截尾
若q1<0,k=1时有负峰值然后截尾
若q1>0,交替式指数衰减
若q1<0,负的平滑式指数衰减
AR
(2)
xt=f1xt-1+f2xt-2+ut
指数或正弦衰减
(两个特征根为实根)
(两个特征根为共轭复根)
k=1,2时有两个峰值然后截尾
(f1>0,f2>0)
(f1>0,f2<0)
MA
(2)
xt=ut+q1ut-1+q2ut-2
k=1,2有两个峰值然后截尾
(q1>0,q2<0)
(q1>0,q2>0)
指数或正弦衰减
(q1>0,q2<0)
(q1>0,q2>0)
ARMA(1,1)
xt=f1xt-1+ut+q1ut-1
k=1有峰值然后按指数衰减
(f1>0,q1>0)
(f1>0,q1<0)
k=1有峰值然后按指数衰减
(f1>0,q1>0)
(f1>0,q1<0)
ARMA(2,1)
xt=f1xt-1+f2xt-2+ut+q1ut-1
k=1有峰值然后按指数或正弦衰减
(f1>0,f2<0,q1>0)
k=1,2有两个峰值然后按指数衰减
(f1>0,f2<0,q1>0)
ARMA(1,2)
xt=f1xt-1+ut+q1ut-1+q2ut-2
k=1,2有两个峰值然后按指数衰减
(f1>0,q1>0,q2<0)
(f1>0,q1>0,q2>0)
k=1有峰值然后按指数或正弦衰减
(f1>0,q1>0,q2<0)
(f1>0,q1>0,q2>0)
ARMA(2,2)
xt=f1xt-1+f2xt-2+ut+q1ut-1+q2ut-2
k=1,2有两个峰值然后按指数或正弦衰减
(f1>0,f2<0,q1>0,q2<0)
(f1>0,f2<0,q1>0,q2>0)
k=1,2有两个峰值然后按指数或正弦衰减
(f1>0,f2<0,q1>0,q2<0)
(f1>0,f2<0,q1>0,q2>0)
2.模型参数的估计
对AR(p)模型因为滞后变量都发生在t期之前,这些滞后变量与误差项ut相互独立,所以对AR(p)模型的参数进行OLS估计,所得参数估计量具有一致性。
对MA(q)和ARMA(p,q)模型的估计比较复杂。
F(L)Ddyt=F(L)xt=Q(L)ut
对于yt假定可以观测到T+d个观测值,即y-d+1,…,y0,y1,…,yT,则经过d次差分之后,xt的样本容量为T。
以{x1,…,xT}为样本估计ARMA(p,q)模型参数(f1,…,fp,q1,…,qq)。
这是一个非线性模型,不能直接用OLS估计参数,一般采用迭代式的非线性最小二乘。
3、诊断与检验
完成模型的识别与参数估计后,应对估计结果进行诊断与检验,以求发现所选用的模型是否合适。
若不合适,应该知道下一步作何种修改。
估计的模型是否成立应该从3个方面检查。
①模型参数估计量必须通过t检验;②模型的全部特征根(包括自回归、移动平均两部分)的倒数都必须在单位圆以内(即模型具有平稳性和可逆性);③模型的残差序列必须通过Q检验(Box-Pierce(1970)提出)。
同时也要尽量做到④模型结构应当尽量简练;⑤参数稳定性要好;⑥预测精度要高。
4、时间序列模型预测
下面以ARMA(1,1)模型为例具体介绍预测方法。
其他形式时间序列模型的预测方法与此类似。
设对时间序列样本{xt},t=1,2,…,T,所拟合的模型是
xt=f1xt-1+ut+q1ut-1
则理论上T+1期xt的值应按下式计算
xT+1=f1xT+uT+1+q1uT
用估计的参数,和分别代替上式中的f1,q1和uT。
上式中的uT+1是未知的,但知E(uT+1)=0,所以取uT+1=0。
xT是已知的(样本值)。
对xT+1的预测按下式进行
=xT+
由xT+1=f1xT+uT+1+q1uT,理论上xT+2的预测式是
xT+2=f1xT+1+uT+2+q1uT+1
仍取uT+1=0,uT+2=0,则xT+2的实际预测式是
=
其中是上一步得到的预测值,与此类推xT+3的预测式是
=
由上可见,随着预测期的加长,预测式xT+1=f1xT+uT+1+q1uT中移动平均项逐步淡出预测模型,预测式变成了纯自回归形式。
对于AR(p)过程,预测式永远是AR(p)形式的,对于MA(q)过程,当预测期超过q时,预测值等于零。
若上面所用的xt是一个差分变量,设Dyt=xt,则得到的预测值相当于D,(t=T+1,T+2,…)。
因为
yt=yt-1+Dyt
所以原序列T+1期预测值应按下式计算
=yT+D
对于t>T+1,预测式是
=+D,t=T+2,T+3,…
其中是相应上一步的预测结果。
7