时间序列93.docx - 冰点文库

资源描述

时间序列93.docx

《时间序列93.docx》由会员分享，可在线阅读，更多相关《时间序列93.docx（15页珍藏版）》请在冰点文库上搜索。

时间序列93.docx

时间序列93

§9.3协整与误差修正模型

一、长期均衡关系与协整

0、问题的提出

•经典回归模型（classicalregressionmodel）是建立在稳定数据变量基础上的，对于非稳定变量，不能使用经典回归模型，否则会出现虚假回归等诸多问题。

•由于许多经济变量是非稳定的，这就给经典的回归分析方法带来了很大限制。

•但是，如果变量之间有着长期的稳定关系，即它们之间是协整的（cointegration），则是可以使用经典回归模型方法建立回归模型的。

•例如，中国居民人均消费水平与人均GDP变量的例子中：

因果关系回归模型要比ARMA模型有更好的预测功能，

其原因在于，从经济理论上说，人均GDP决定着居民人均消费水平，而且它们之间有着长期的稳定关系，即它们之间是协整的（cointegration）。

1、长期均衡

经济理论指出，某些经济变量间确实存在着长期均衡关系，这种均衡关系意味着经济系统不存在破坏均衡的内在机制，如果变量在某时期受到干扰后偏离其长期均衡点，则均衡机制将会在下一期进行调整以使其重新回到均衡状态。

假设X与Y间的长期“均衡关系”由式描述

式中:

t是随机扰动项。

该均衡关系意味着:

给定X的一个值，Y相应的均衡值也随之确定为0+1X。

在t-1期末，存在下述三种情形之一：

（1）Y等于它的均衡值：

Yt-1=0+1Xt；

（2）Y小于它的均衡值：

Yt-1<0+1Xt；

（3）Y大于它的均衡值：

Yt-1>0+1Xt；

在时期t，假设X有一个变化量Xt，如果变量X与Y在时期t与t-1末期仍满足它们间的长期均衡关系，则Y的相应变化量由式给出:

式中，vt=t-t-1。

实际情况往往并非如此

如果t-1期末，发生了上述第二种情况，即Y的值小于其均衡值，则Y的变化往往会比第一种情形下Y的变化Yt大一些；

反之，如果Y的值大于其均衡值，则Y的变化往往会小于第一种情形下的Yt。

可见，如果Yt=0+1Xt+t正确地提示了X与Y间的长期稳定的“均衡关系”，则意味着Y对其均衡点的偏离从本质上说是“临时性”的。

因此，一个重要的假设就是:

随机扰动项t必须是平稳序列。

显然，如果t有随机性趋势（上升或下降），则会导致Y对其均衡点的任何偏离都会被长期累积下来而不能被消除。

式Yt=0+1Xt+t中的随机扰动项也被称为非均衡误差（disequilibriumerror），它是变量X与Y的一个线性组合：

（*）

因此，如果Yt=0+1Xt+t式所示的X与Y间的长期均衡关系正确的话，（*）式表述的非均衡误差应是一平稳时间序列，并且具有零期望值，即是具有0均值的I（0）序列。

从这里已看到，非稳定的时间序列，它们的线性组合也可能成为平稳的。

例如：

假设Yt=0+1Xt+t式中的X与Y是I

（1）序列，如果该式所表述的它们间的长期均衡关系成立的话，则意味着由非均衡误差（*）式给出的线性组合是I（0）序列。

这时我们称变量X与Y是协整的（cointegrated）。

⒉协整

如果序列{X1t,X2t,…,Xkt}都是d阶单整，存在向量=（1,2,…,k），使得

Zt=XT~I（d-b）

其中，b>0，X=（X1t,X2t,…,Xkt）T，则认为序列{X1t,X2t,…,Xkt}是（d,b）阶协整，记为Xt~CI（d,b），为协整向量（cointegratedvector）。

在中国居民人均消费与人均GDP的例中，该两序列都是2阶单整序列，而且可以证明它们有一个线性组合构成的新序列为0阶单整序列，于是认为该两序列是（2,2）阶协整。

由此可见:

如果两个变量都是单整变量，只有当它们的单整阶数相同时，才可能协整；如果它们的单整阶数不相同，就不可能协整。

三个以上的变量，如果具有不同的单整阶数，有可能经过线性组合构成低阶单整变量。

例如，如果存在：

并且

那么认为：

从协整的定义可以看出:

（d,d）阶协整是一类非常重要的协整关系，它的经济意义在于：

两个变量，虽然它们具有各自的长期波动规律，但是如果它们是（d,d）阶协整的，则它们之间存在着一个长期稳定的比例关系。

例如：

前面提到的中国CPC和GDPPC，它们各自都是2阶单整，并且将会看到，它们是（2,2）阶协整，说明它们之间存在着一个长期稳定的比例关系，从计量经济学模型的意义上讲，建立如下居民人均消费函数模型

变量选择是合理的，随机误差项一定是“白噪声”（即均值为0，方差不变的稳定随机序列），模型参数有合理的经济解释。

这也解释了尽管这两时间序列是非稳定的，但却可以用经典的回归分析方法建立回归模型的原因。

•从这里，我们已经初步认识到：

检验变量之间的协整关系，在建立计量经济学模型中是非常重要的。

而且，从变量之间是否具有协整关系出发选择模型的变量，其数据基础是牢固的，其统计性质是优良的。

二、协整检验

1、两变量的Engle-Granger检验

为了检验两变量Yt,Xt是否为协整，Engle和Granger于1987年提出两步检验法，也称为EG检验。

第一步，用OLS方法估计方程Yt=0+1Xt+t

并计算非均衡误差，得到：

称为协整回归（cointegrating）或静态回归（staticregression）。

由于协整回归中已含有截距项，则检验模型中无需再用截距项。

如使用模型1

进行检验时，拒绝零假设H0：

=0，意味着误差项et是平稳序列，从而说明X与Y间是协整的。

需要注意是，这里的DF或ADF检验是针对协整回归计算出的误差项

而OLS法采用了残差最小平方和原理，因此估计量是向下偏倚的，这样将导致拒绝零假设的机会比实际情形大。

于是对et平稳性检验的DF与ADF临界值应该比正常的DF与ADF临界值还要小。

•MacKinnon（1991）通过模拟试验给出了协整检验的临界值，表9.3.1是双变量情形下不同样本容量的临界值。

•例9.3.1检验中国居民人均消费水平CPC与人均国内生产总值GDPPC的协整关系。

在前文已知CPC与GDPPC都是I

（2）序列，而§2.10中已给出了它们的回归式

R2=0.9981

通过对该式计算的残差序列作ADF检验，得适当检验模型

（-4.47）（3.93）（3.05）

（1）=0.00LM

（2）=0.00

t=-4.47<-3.75=ADF0.05，拒绝存在单位根的假设，残差项是稳定的，因此中国居民人均消费水平与人均GDP是（2,2）阶协整的，说明了该两变量间存在长期稳定的“均衡”关系。

2、多变量协整关系的检验—扩展的E-G检验

多变量协整关系的检验要比双变量复杂一些，主要在于协整变量间可能存在多种稳定的线性组合。

假设有4个I

（1）变量Z、X、Y、W，它们有如下的长期均衡关系：

（*）

其中，非均衡误差项t应是I（0）序列：

（**）

然而，如果Z与W，X与Y间分别存在长期均衡关系：

则非均衡误差项v1t、v2t一定是稳定序列I（0）。

于是它们的任意线性组合也是稳定的。

例如

（***）

一定是I（0）序列。

由于vt象（**）式中的t一样，也是Z、X、Y、W四个变量的线性组合，由此（***）式也成为该四变量的另一稳定线性组合。

（1,-0,-1,-2,-3）是对应于（**）式的协整向量，（1,-0-0,-1,1,-1）是对应于（***）式的协整向量。

检验程序：

对于多变量的协整检验过程，基本与双变量情形相同，即需检验变量是否具有同阶单整性，以及是否存在稳定的线性组合。

在检验是否存在稳定的线性组合时，需通过设置一个变量为被解释变量，其他变量为解释变量，进行OLS估计并检验残差序列是否平稳。

如果不平稳，则需更换被解释变量，进行同样的OLS估计及相应的残差项检验。

当所有的变量都被作为被解释变量检验之后，仍不能得到平稳的残差项序列，则认为这些变量间不存在（d,d）阶协整。

同样地，检验残差项是否平稳的DF与ADF检验临界值要比通常的DF与ADF检验临界值小，而且该临界值还受到所检验的变量个数的影响。

表9.3.2给出了MacKinnon（1991）通过模拟试验得到的不同变量协整检验的临界值。

2、多变量协整关系的检验—JJ检验

•Johansen于1988年，以及与Juselius于1990年提出了一种用极大或然法进行检验的方法，通常称为JJ检验。

•《高等计量经济学》（清华大学出版社，2000年9月）P279-282.

•E-views中有JJ检验的功能。

三、误差修正模型

1、误差修正模型

前文已经提到，对于非稳定时间序列，可通过差分的方法将其化为稳定序列，然后才可建立经典的回归分析模型。

如：

建立人均消费水平（Y）与人均可支配收入（X）之间的回归模型：

式中，vt=t-t-1.

然而，这种做法会引起两个问题：

（1）如果X与Y间存在着长期稳定的均衡关系

Yt=0+1Xt+t

且误差项t不存在序列相关，则差分式

Yt=1Xt+t

中的t是一个一阶移动平均时间序列，因而是序列相关的；

（2）如果采用差分形式进行估计，则关于变量水平值的重要信息将被忽略，这时模型只表达了X与Y间的短期关系，而没有揭示它们间的长期关系。

因为，从长期均衡的观点看，Y在第t期的变化不仅取决于X本身的变化，还取决于X与Y在t-1期末的状态，尤其是X与Y在t-1期的不平衡程度。

另外，使用差分变量也往往会得出不能令人满意回归方程

例如，使用Yt=1Xt+t回归时，很少出现截距项显著为零的情况，即我们常常会得到如下形式的方程：

（*）

在X保持不变时，如果模型存在静态均衡（staticequilibrium），Y也会保持它的长期均衡值不变。

但如果使用（*）式，即使X保持不变，Y也会处于长期上升或下降的过程中（Why?

），这意味着X与Y间不存在静态均衡。

这与大多数具有静态均衡的经济理论假说不相符。

可见，简单差分不一定能解决非平稳时间序列所遇到的全部问题，因此，误差修正模型便应运而生。

误差修正模型（ErrorCorrectionModel，简记为ECM）是一种具有特定形式的计量经济学模型，它的主要形式是由Davidson、Hendry、Srba和Yeo于1978年提出的，称为DHSY模型。

为了便于理解，我们通过一个具体的模型来介绍它的结构。

假设两变量X与Y的长期均衡关系为:

Yt=0+1Xt+t

由于现实经济中X与Y很少处在均衡点上，因此实际观测到的只是X与Y间的短期的或非均衡的关系，假设具有如下（1,1）阶分布滞后形式

该模型显示出第t期的Y值，不仅与X的变化有关，而且与t-1期X与Y的状态值有关。

由于变量可能是非平稳的，因此不能直接运用OLS法。

对上述分布滞后模型适当变形得

或

（**）

式中，

如果将（**）中的参数，与Yt=0+1Xt+t中的相应参数视为相等，则（**）式中括号内的项就是t-1期的非均衡误差项。

（**）式表明：

Y的变化决定于X的变化以及前一时期的非均衡程度。

同时，（**）式也弥补了简单差分模型Yt=1Xt+t的不足，因为该式含有用X、Y水平值表示的前期非均衡程度。

因此，Y的值已对前期的非均衡程度作出了修正。

（**）

称为一阶误差修正模型（first-ordererrorcorrectionmodel）。

（**）式可以写成：

（***）

其中:

ecm表示误差修正项。

由分布滞后模型

知，一般情况下||<1，由关系式=1-得0<<1。

可以据此分析ecm的修正作用：

（1）若（t-1）时刻Y大于其长期均衡解0+1X，ecm为正，则（-ecm）为负，使得Yt减少；

（2）若（t-1）时刻Y小于其长期均衡解0+1X，ecm为负，则（-ecm）为正，使得Yt增大。

（***）体现了长期非均衡误差对的控制。

需要注意的是：

在实际分析中，变量常以对数的形式出现。

其主要原因在于变量对数的差分近似地等于该变量的变化率，而经济变量的变化率常常是稳定序列，因此适合于包含在经典回归方程中。

于是:

（1）长期均衡模型

Yt=0+1Xt+t

中的1可视为Y关于X的长期弹性（long-runelasticity）

（2）短期非均衡模型

Yt=0+1Xt+2Xt-1+Yt-1+t

式中的1可视为Y关于X的短期弹性（short-runelasticity）。

更复杂的误差修正模型可依照一阶误差修正模型类似地建立。

如具有季度数据的变量，可在短期非均衡模型Yt=0+1Xt+2Xt-1+Yt-1+t

中引入更多的滞后项。

引入二阶滞后的模型为

经过适当的衡等变形，可得如下二阶误差修正模型

（*）

引入三阶滞后项的误差修正模型与（*）式相仿，只不过模型中多出差分滞后项Yt-2，Xt-2，。

多变量的误差修正模型也可类似地建立。

如三个变量如果存在如下长期均衡关系

则其一阶非均衡关系可写成

于是它的一个误差修正模型为

2、误差修正模型的建立

（1）Granger表述定理

误差修正模型有许多明显的优点：

如

a）一阶差分项的使用消除了变量可能存在的趋势因素，从而避免了虚假回归问题；

b）一阶差分项的使用也消除模型可能存在的多重共线性问题；

c）误差修正项的引入保证了变量水平值的信息没有被忽视；

d）由于误差修正项本身的平稳性，使得该模型可以用经典的回归方法进行估计，尤其是模型中差分项可以使用通常的t检验与F检验来进行选取；等等。

因此，一个重要的问题就是：

是否变量间的关系都可以通过误差修正模型来表述？

就此问题，Engle与Granger1987年提出了著名的Grange表述定理（Grangerrepresentaiontheorem）：

如果变量X与Y是协整的，则它们间的短期非均衡关系总能由一个误差修正模型表述：

0<<1（*）

式中，t-1是非均衡误差项或者说成是长期均衡偏差项，是短期调整参数。

对于（1,1）阶自回归分布滞后模型

Yt=0+1Xt+2Xt-1+Yt-1+t

如果Yt~I

（1）,Xt~I

（1）;那么

的左边Yt~I（0），右边的Xt~I（0），因此，只有Y与X协整，才能保证右边也是I（0）。

因此，建立误差修正模型，需要

首先对变量进行协整分析，以发现变量之间的协整关系，即长期均衡关系，并以这种关系构成误差修正项。

然后建立短期模型，将误差修正项看作一个解释变量，连同其它反映短期波动的解释变量一起，建立短期模型，即误差修正模型。

注意，由于

Y=lagged（Y,X）+t-1+t0<<1

中没有明确指出Y与X的滞后项数，因此，可以是多个；

同时，由于一阶差分项是I（0）变量，因此模型中也允许使用X的非滞后差分项Xt。

Granger表述定理可类似地推广到多个变量的情形中去。

（2）Engle-Granger两步法

由协整与误差修正模型的的关系，可以得到误差修正模型建立的E-G两步法：

第一步，进行协整回归（OLS法），检验变量间的协整关系，估计协整向量（长期均衡关系参数）；

第二步，若协整性存在，则以第一步求到的残差作为非均衡误差项加入到误差修正模型中，并用OLS法估计相应参数。

需要注意的是：

在进行变量间的协整检验时，如有必要可在协整回归式中加入趋势项，这时，对残差项的稳定性检验就无须再设趋势项。

另外，第二步中变量差分滞后项的多少，可以残差项序列是否存在自相关性来判断，如果存在自相关，则应加入变量差分的滞后项。

（3）直接估计法

也可以采用打开误差修整模型中非均衡误差项括号的方法直接用OLS法估计模型。

但仍需事先对变量间的协整关系进行检验。

如对双变量误差修正模型

可打开非均衡误差项的括号直接估计下式：

这时短期弹性与长期弹性可一并获得。

需注意的是，用不同方法建立的误差修正模型结果也往往不一样。

例9.3.2中国居民消费的误差修正模型

经济理论指出，居民消费支出是其实际收入的函数。

以中国国民核算中的居民消费支出经过居民消费价格指数缩减得到中国居民实际消费支出时间序列（C）；

以支出法GDP对居民消费价格指数缩减近似地代表国民收入时间序列（GDP）

时间段为1978~2000（表9.3.3）

（1）对数据lnC与lnGDP进行单整检验

容易验证lnC与lnGDP是一阶单整的，它们适合的检验模型如下：

（0.381）（-0.41）（2.66）（2.26）（2.54）

（1）=0.38LM

（2）=0.67LM（3）=2.34LM（4）=2.46

（2）检验lnC与lnGDP的协整性，并建立长期均衡关系

首先，建立lnC与lnGDP的回归模型

（0.30）（57.48）

R2=0.994DW=0.774

发现有残关项有较强的一阶自相关性。

考虑加入适当的滞后项，得lnC与lnGDP的分布滞后模型

（1.63）（6.62）（4.92）（-2.17）

R2=0.994DW=1.92LM

（1）=0.00LM

（2）=2.31

自相关性消除，因此可初步认为是lnC与lnGDP的长期稳定关系。

残差项的稳定性检验：

（-4.32）

R2=0.994DW=2.01LM

（1）=0.04LM

（2）=1.34

t=-4.32<-3.64=ADF0.05

说明lnC与lnGDP是（1，1）阶协整的，（*）式即为它们长期稳定的均衡关系:

（*）

（3）建立误差修正模型

•

以稳定的时间序列做为误差修正项，可建立如下

误差修正模型:

（**）

（6.96）（2.96）（-1.91）（-3.15）

R2=0.994DW=2.06LM

（1）=0.70LM

（2）=2.04

由（*）式

可得lnC关于lnGDP的长期弹性：

（0.698-0.361）/（1-0.622）=0.892；

由（**）式可得lnC关于lnGDP的短期弹性：

0.686

下面用打开误差修正项括号的方法直接估计误差修正模型，适当估计式为:

（1.63）（6.62）（-2.99）（2.88）

R2=0.791=0.0064DW=1.93LM

（2）=2.31LM（3）=2.78

写成误差修正模型的形式如下

（***）

由（***）式知，lnC关于lnGDP的短期弹性为0.698，长期弹性为0.892。

可见两种方法的结果非常接近。

（4）预测

由（*）式

给出1998年关于长期均衡点的偏差：

=ln（18230）-0.152-0.698ln（39008）-0.662ln（17072）+0.361ln（36684）=0.0125

由（**）式

预测1999年的短期波动：

lnC99=0.686（ln（41400）-ln（39008））+0.784（ln（18230）-ln（17072））

-0.484（ln（39008）-ln（36684））-1.163×0.0125=0.048

于是

按照（***）式

预测的结果为:

lnC99=0.698（ln（41400）-ln（39008））-0.378（ln（18230）-0.405

-0.892ln（39008））=0.051

于是

以当年价计的1999年实际居民消费支出为39334亿元，用居民消费价格指数（1990=100）紧缩后约为19697亿元，因此：

两个预测结果的相对误差分别为2.9%与2.6%。

展开阅读全文