第29章空间计量经济学Word文档下载推荐.docx
《第29章空间计量经济学Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《第29章空间计量经济学Word文档下载推荐.docx(39页珍藏版)》请在冰点文库上搜索。
反之,则wij
=0。
比照(国际)象棋中棋子的行走路线,相邻关系可分为以下几种:
(1)车相邻(rookcontiguity):
两个相邻区域有共同的边。
(2)象相邻(bishopcontiguity):
两个相邻区域有共同的顶点,但没有共同的边。
(3)后相邻(queencontiguity):
两个相邻区域有共同的边或顶点。
车相邻象相邻后相邻
图29.1常用相邻关系
在实践中,为了区分“边”与“点”,须设定一个最小距离,在此距离以下为点,而在此距离以上为边。
究竟使用车、象或后相邻,取决于具体情况。
比如,区域i与区域j仅在一点相交(象相邻),但有一条主要高速公路通过此点连接两区域,则不宜使用车相邻。
假设有如下四个区域,其变量取值分别为x
=(x1x2
x3x4)'
。
图29.2假想的四个区域
其空间权重矩阵为:
⎛0
1
1
=ç
10
⎝
1⎫
⎪
W⎪
1⎪
⎭
第一行表示,区域1与其余三个区域均相邻;
第二行表示,区
域2与区域1、区域3相邻,但不与区域4相邻;
以此类推。
空间权重矩阵考虑的是一阶邻居,还可以考虑二阶邻居,即邻居的邻居,可用矩阵W2来表示。
矩阵W2的主对角线上元素一般不再为0,这意味着邻居的邻居也包括自己。
实践中,有时对空间权重矩阵进行“行标准化”(rowstandardization),即将矩阵中的每个元素(记为wij)除以其所在行元素之和,以保证每行元素之和为1:
wij
wij
ij
≡∑w
j
如果区域i为孤岛,与其他区域均不相邻,则上式分母为0,并不适用;
可将分母改为max(1,∑wij)。
不包含孤岛的行标准化矩阵也称为“行随机矩阵”(row-stochasticmatrix),所有元素均介于0与1之间,且每行元素之和为1,在形式上与离散型概率分布一样。
将前面的空间权重矩阵行标准化可得(仍记为W):
⎛0131313⎫
120120⎪
1313013⎪
⎝⎭
行标准化的好处在于,如果将行标准化矩阵W乘以x,则可得到每个区域邻居的平均值。
在上例中:
⎛0131313⎫⎛x1⎫
⎡(x2+x3
+x4)3⎤
12
13
⎪ç
x⎪
⎢(x
+x)2⎥
Wx=
2⎪=⎢13⎥
3⎪ç
x3⎪⎢(x1+x2+x4)3⎥
120120
⎝⎭⎝4⎭⎣13⎦
比如,区域1的邻居为区域2,3和4,而上式右边第一行元素
正好为(x2
+
x3
x4)3,即区域1邻居的平均值;
比照时间序列中时间滞后(timelag)的概念,Wx也被称为x的“空间滞后”(spatiallag),即x邻居的平均取值。
行标准化之后的空间权重矩阵一般不再是对称矩阵,这是它的缺陷之一。
由于每行元素之和均为1,这意味着区域i所受其邻居的影响之
和一定等于区域j所受其邻居的影响之和(任意i≠
过强,这是行标准化的另一局限。
j);
此假定可能
定义相邻关系的另一方法基于区域间的距离。
记区域i与区域j的距离为dij,可定义空间权重如下:
=⎧1
⎨0
⎩
若dij<
d
若dij≥d
其中,d为事先给定的距离临界值。
也可直接以距离之倒数(inversedistance)作为空间权重:
wij=d
在上式中,距离dij既可以是地理距离,比如直线距离或大圆距
离(greatcircledistance);
也可以是基于运输成本或旅行时间的经济距离;
甚至社交网络中的距离。
例:
林光平等(2005)使用基于地理相邻关系的简单权重矩阵W来研究我国28个省市在1978-2002年期间实际人均GDP的收敛情况。
但相邻地区经济上的相互关系并不完全相同。
为此,林光平等(2005)使用地区间人均GDP的差额作为测度地
区间“经济距离”的指标,并引入经济空间权重矩阵W*=W⨯E,
其中矩阵E的主对角线元素均为0,非主对角线的(i,j)元素为
Eij=
1(i≠
j),Yi为地区i样本期间的人均实际GDP平均值。
29.3空间自相关
在使用空间计量方法前,首先要考察数据是否存在空间依赖性。
如果不存在,则使用标准的计量方法即可;
如果存在,则可使用空间计量方法。
比照时间序列(timeseries),空间数据有时也称为“空间序列”(spatialseries)。
时间序列可视为在时间轴上分布的随机过程,而空间数据(序列)则为在空间分布的随机过程。
时间序列的一个重要特性是可能存在自相关,特别是一阶自相关。
对于空间序列,自相关的情形则更为复杂;
因为时间序列只可能在一个方向上相关(过去影响现在,但现在无法影响过去),而空间序列则可以在多个方向上相关,而且可以互相影响(xi影响xj,而xj也影响xi)。
“空间自相关”(spatialautocorrelation)可理解为位置相近的区域具有相似的变量取值。
如果高值与高值聚集在一起,低值与低值聚集在一起,则为“正空间自相关”(positivespatialautocorrelation)。
如果高值与低值相邻,则为“负空间自相关”(negativespatialautocorrelation);
较少见。
如果高值与低值完全随机地分布,则不存在空间自相关。
考虑空间序列{x}n。
文献中提出了一系列度量空间自相关的方法,最为流行的是“莫兰指数I”(Moran’sI):
nn
∑∑wij(xi
-
x)(xj
x)
I=i=1
j=1
S∑∑w
2
i=1j=1
∑
其中,S2=
ni=1
(xin
-x)2
为样本方差,wij为空间权重矩阵的(i,j)
元素(用来度量区域i与区域j之间的距离),而∑∑wij为所有空间
权重之和。
i=1
如果空间权重矩阵为行标准化,则∑∑wij
=n,莫兰指数I为:
x)(xj
n
I=i=1j=1
∑(xi
莫兰指数I的取值一般介于-1到1之间,大于0表示正自相关,即高值与高值相邻、低值与低值相邻;
小于0表示负自相关,即高值与低值相邻。
如果莫兰指数I接近于0,则表明空间分布是随机的,不存在空间自相关。
莫兰指数I可视为观测值与其空间滞后(spatiallag)的相关系数。
如果将观测值与其空间滞后画成散点图,称为“莫兰散点图”
(Moranscatterplot),则莫兰指数I就是该散点图回归线的斜率。
考虑原假设“H0:
Cov(xi,
xj)=0,
∀i≠
j”(即不存在空间自相关)。
在此原假设下,莫兰指数I的期望值为
E(I)=
-1
n-1
莫兰指数I的方差表达式更为复杂,记为Var(I)。
标准化的莫兰指数I服从渐近标准正态分布:
I*≡
I-E(I)
−d−→N(0,1)
在使用莫兰指数I检验空间自相关时,须注意两个问题。
问题之一,莫兰指数I取决于空间矩阵W,如果空间矩阵设定不正确,则可能导致错误的结果。
问题之二,莫兰指数I的核心成分为(xi
x),其隐含假设
是{x}
的期望值为常数(constantmean),不存在任何趋势(trend)。
如果存在趋势,则可能导致检验结果出现偏差。
为了解决问题一,须仔细选择合适的空间矩阵,或使用不同的空间矩阵以考察结果的稳健性。
为了解决问题二,可引入协变量,通过回归的方法去掉趋势,然后对残差项进行莫兰指数I检验。
以上的莫兰指数I也被称为“全局莫兰指数I”(globalMoran’sI),
考察整个空间序列{x}n
的空间集聚情况。
如果想知道某区域i附近的空间集聚情况,可使用“局部莫兰指数I”(localMoran’sI):
(xi-x)n
Ii=
2∑wij(xj
S
局部莫兰指数I的含义与全局莫兰指数I相似。
莫兰指数I并非唯一的空间自相关指标,另一常用指标为“吉尔里指数C”(Geary’sC)(Geary,1954),也称为“吉尔里相邻比率”(Geary’sContiguityRatio):
(n-1)∑∑w(x
C=⎛
⎫⎡
ijij
⎤
n
2ç
∑∑wij⎪⎢∑(xi
-x)⎥
⎝i=1
⎭⎣i=1⎦
吉尔里指数C的核心成分为(x-x)2。
ij
吉尔里指数C的取值一般介于0到2之间(2不是严格上界),大于1表示负相关,等于1表示不相关,而小于1表示正相关。
吉尔里指数C与莫兰指数I呈反向变动;
前者比后者对于局部空间自相关更为敏感。
在不存在空间自相关的原假设下,吉尔里指数C的期望值为1,而方差的表达式较复杂,记为Var(C)。
标准化的吉尔里指数C服从渐近标准正态分布:
C*≡
C-1
莫兰指数I与吉尔里指数C的共同缺点在于,即无法分别“热点”(hotspot)与“冷点”(coldspot)区域。
所谓热点区域,即高值与高值聚集的区域;
而冷点区域则是低值与低值聚集的区域。
热点区域与冷点区域都表现为正自相关。
GetisandOrd(1992)提出了以下“Getis-Ord指数G”:
∑∑wijxixj
G=i=1j=1
∑∑xixj
i=1j≠i
其中,xi
>
0,
∀i;
而wij来自非标准化的对称空间权重矩阵,且
所有元素均为0或1。
如果样本中高值聚集在一起,则G较大;
如果低值聚集在一起,则G较小。
∑∑wij
在无空间自相关的原假设下,E(G)=
i=1j≠i。
n(n-1)
如果G值大于此期望值,则表示存在热点区域;
如果G值小于此期望值,则表示存在冷点区域。
标准化的G服从渐近标准正态分布:
G*≡
G-E(G)
如果G*>
1.96,则可在5%水平上拒绝无空间自相关的原假设,
认为存在空间正自相关,且存在热点区域。
如果G*<
-1.96,则可在5%水平上拒绝无空间自相关的原假设,
认为存在空间正自相关,且存在冷点区域。
如果要考察某区域i是否为热点或冷点,则可使用“局部
Getis-Ord指数G”:
Gi=
∑wijxjj≠i
∑x
j≠i
以上各种空间自相关指标仅提供是否存在空间效应的初步检验,深入检验有赖于建立正式的空间计量模型。
29.4空间自回归模型
对于时间序列,最常见的建模方式为一阶自回归AR
(1)。
空间自回归的形式更为复杂,因为空间滞后可以来自不同的方向,而且可以双向。
对于空间序列{y}n
(样本容量为n),即使假设空间自相关的形
式为线性,待估计的参数在理论上最多可达(n2-n)个(每个区域最
多可受n-1个区域影响,共有n个区域),大大超出样本容量。
必须假设空间依赖性服从某种共同的模式,才能简化参数。
首先回顾时间序列的一阶自相关模型:
yt=
βyt-1+εt
(t=2,,n)
假设n=4,而y1=ε1。
将这4个方程叠放在一起可得:
⎛y1⎫
⎛0000⎫⎛
y1⎫⎛ε1⎫
y
y=ç
2⎪=
1000⎪ç
βç
⎪ç
⎪ç
2⎪+ç
ε
2⎪≡
βWy+ε
y3⎪
0100⎪ç
y3⎪ç
ε3⎪
y
⎝4⎭
0010⎪ç
⎝⎭⎝
W
4⎭⎝4⎭
其中,矩阵W的次主对角线元素均为1,而其他元素都为0。
矩阵W可视为“时间滞后矩阵”,它之所以呈现出次对角线元素为1而其他元素为0的规律性排列,正是由于时间滞后在方向上的单一性。
对于空间序列,矩阵W则为空间权重矩阵,其元素排列方式表现出多样性(因为空间自相关可以多方向)。
引入以下“空间自回归模型”(SpatialAutoregression,简记SAR):
y=λWy+ε
其中,W为已知的空间权重矩阵(非随机),而空间依赖性仅由单一参数λ。
λ度量空间滞后Wy对y的影响,称为“空间自回归系数”(spatialautoregressiveparameter)。
此模型也称为“空间滞后模型”(SpatialLagModel)。
相邻地区的被解释变量(比如犯罪率)可能相互依赖,并最终形成一个均衡的结果。
又比如,假设以地区税收为被解释变量,则不同地区的政府出于相互竞争或博弈的考虑(比如,竞相吸引FDI),在制定本地区税收时,会考虑周边地区的税收水平。
假设W为前例的权重矩阵,则方程可写为:
⎛0111⎫⎛
⎛y2+
y3+
y4⎫
⎛ε1⎫
y⎪
1010⎪ç
ε⎪
y+y
2⎪=λç
2⎪=λç
13⎪+ç
2⎪
1101⎪ç
y1+y2+
y4⎪ç
⎝13
⎭⎝4⎭
如果对此联立方程系统进行OLS估计,将导致联立方程偏差
(simultaneitybias)。
由于空间依赖性,导致变量{y}n
之间互相影响,产生内生性。
更一般地,可在方程中加入自变量:
y=λWy+Xβ+ε
其中,X为n⨯k数据矩阵,包括k列解释变量;
βk⨯1为相应系数。
此方程也称为SAR模型。
如果λ=0,则简化为一般的线性回归模型。
可通过检验原假设“H0:
λ=0”来考察是否存在空间效应。
对于空间自回归模型,常使用MLE估计。
首先,假设扰动项ε~
N(0,σ2I)。
其次,方程可写为
Ay
≡(I
-λW)y=
Xβ+ε
其中,A≡(I-λW)。
由于雅可比行列式J≡=
==A'
=
A,根据
多维正态密度公式,可写出样本的似然函数:
L(y|λ,σ2,β)=(2πσ2)-n
2(abs
A)exp⎧-
2σ2
(Ay-
Xβ)'
Xβ)⎫
⎨
⎬
⎩⎭
其中,abs
A表示行列式
A的绝对值。
对数似然函数为:
lnL(y|λ,σ2,β)=-nln2π-nlnσ2+ln(absA)-1(Ay-
Xβ)
222σ2
此最大化问题分两步。
第一步,在给定λ的情况下,选择最优的β,σ2。
第二步,代入第一步的最优β,σ2,选择最优的λ。
在第一步,由于β只出现于最后一项,故等价于使
Xβ)最小,即Ay对X进行回归:
βˆ=(X'
X)-1X'
=(X'
(I
λW)y
β
y-λ(X'
Wy≡
ˆ-λβˆL
其中,
ˆ≡(X'
(y对X的回归系数),而
βˆL
≡(X'
Wy(Wy对X的回归系数)。
只要知道λ,即可计算βˆ。
对σ2求偏导可得σ2的MLE估计:
σˆ2
=e'
e=
(MXAy)'
(MXAy)
其中,e为Ay对X回归的残差向量,MX
灭矩阵。
≡In
-X(X'
为消
由于Ay
=(I
λW)y,故
e=MXAy=
MX(I
MXy-λMXWy
≡e0
λeL
其中,e0
≡MX
y(y对X的回归残差),而eL
≡MXWy(Wy对X的
回归残差)。
代入可得:
(e0
-λeL)'
λeL)
只要知道λ,即可计算σˆ2。
在第二步,将βˆ(λ),σˆ2(λ)代入对数似然函数,可得“集中对数
似然函数”(concentratedloglikelihoodfunction),它只是λ的函数。
由于λ出现在行列式A=
I-λW
,给计算带来不便。
可利用等式A
=∏(1-λvi)来计算,其中v1,,vn为矩阵A特征值
(eigenvalues)。
为保证扰动项协方差矩阵为正定,还须限制λ的取值为
1<
λ<
1,其中v与v分别为矩阵A的最小与最大特征值,
vminvmax
而vmin一定为负数。
min
max
对于MLE估计量的渐近协方差矩阵,通过信息矩阵来估计:
⎪⎧⎡∂2lnL⎤⎫⎪-1
I(θ)-1
≡-⎨E⎢⎥⎬
⎩⎪⎣∂θ∂θ'
⎦⎭⎪
其中,θ=(λ,σ2,β)。
对于空间自回归模型y
=λWy+
Xβ+ε,解释变量X对y的边际
效应并非β,因为X对y产生作