第29章空间计量经济学Word文档下载推荐.docx

资源描述

第29章空间计量经济学Word文档下载推荐.docx

《第29章空间计量经济学Word文档下载推荐.docx》由会员分享，可在线阅读，更多相关《第29章空间计量经济学Word文档下载推荐.docx（39页珍藏版）》请在冰点文库上搜索。

第29章空间计量经济学Word文档下载推荐.docx

反之，则wij

=0。

比照（国际）象棋中棋子的行走路线，相邻关系可分为以下几种：

（1）车相邻（rookcontiguity）：

两个相邻区域有共同的边。

（2）象相邻（bishopcontiguity）：

两个相邻区域有共同的顶点，但没有共同的边。

（3）后相邻（queencontiguity）：

两个相邻区域有共同的边或顶点。

车相邻象相邻后相邻

图29.1常用相邻关系

在实践中，为了区分“边”与“点”，须设定一个最小距离，在此距离以下为点，而在此距离以上为边。

究竟使用车、象或后相邻，取决于具体情况。

比如，区域i与区域j仅在一点相交（象相邻），但有一条主要高速公路通过此点连接两区域，则不宜使用车相邻。

假设有如下四个区域，其变量取值分别为x

=（x1x2

x3x4）'

。

图29.2假想的四个区域

其空间权重矩阵为：

⎛0

=ç

⎝

1⎫

⎪

W⎪

1⎪

⎭

第一行表示，区域1与其余三个区域均相邻；

第二行表示，区

域2与区域1、区域3相邻，但不与区域4相邻；

以此类推。

空间权重矩阵考虑的是一阶邻居，还可以考虑二阶邻居，即邻居的邻居，可用矩阵W2来表示。

矩阵W2的主对角线上元素一般不再为0，这意味着邻居的邻居也包括自己。

实践中，有时对空间权重矩阵进行“行标准化”（rowstandardization），即将矩阵中的每个元素（记为wij）除以其所在行元素之和，以保证每行元素之和为1：

wij

≡∑w

如果区域i为孤岛，与其他区域均不相邻，则上式分母为0，并不适用；

可将分母改为max（1,∑wij）。

不包含孤岛的行标准化矩阵也称为“行随机矩阵”（row-stochasticmatrix），所有元素均介于0与1之间，且每行元素之和为1，在形式上与离散型概率分布一样。

将前面的空间权重矩阵行标准化可得（仍记为W）：

⎛0131313⎫

120120⎪

1313013⎪



⎝⎭

行标准化的好处在于，如果将行标准化矩阵W乘以x，则可得到每个区域邻居的平均值。

在上例中：

⎛0131313⎫⎛x1⎫

⎡（x2+x3

+x4）3⎤

⎪ç

x⎪

⎢（x

+x）2⎥

Wx=

2⎪=⎢13⎥

3⎪ç

x3⎪⎢（x1+x2+x4）3⎥

120120

⎝⎭⎝4⎭⎣13⎦

比如，区域1的邻居为区域2，3和4，而上式右边第一行元素

正好为（x2

x4）3，即区域1邻居的平均值；

比照时间序列中时间滞后（timelag）的概念，Wx也被称为x的“空间滞后”（spatiallag），即x邻居的平均取值。

行标准化之后的空间权重矩阵一般不再是对称矩阵，这是它的缺陷之一。

由于每行元素之和均为1，这意味着区域i所受其邻居的影响之

和一定等于区域j所受其邻居的影响之和（任意i≠

过强，这是行标准化的另一局限。

j）；

此假定可能

定义相邻关系的另一方法基于区域间的距离。

记区域i与区域j的距离为dij，可定义空间权重如下：

=⎧1

⎨0

⎩

若dij<

若dij≥d

其中，d为事先给定的距离临界值。

也可直接以距离之倒数（inversedistance）作为空间权重：

wij=d

在上式中，距离dij既可以是地理距离，比如直线距离或大圆距

离（greatcircledistance）；

也可以是基于运输成本或旅行时间的经济距离；

甚至社交网络中的距离。

例：

林光平等（2005）使用基于地理相邻关系的简单权重矩阵W来研究我国28个省市在1978-2002年期间实际人均GDP的收敛情况。

但相邻地区经济上的相互关系并不完全相同。

为此，林光平等（2005）使用地区间人均GDP的差额作为测度地

区间“经济距离”的指标，并引入经济空间权重矩阵W*=W⨯E，

其中矩阵E的主对角线元素均为0，非主对角线的（i,j）元素为

Eij=

1（i≠

j），Yi为地区i样本期间的人均实际GDP平均值。

29.3空间自相关

在使用空间计量方法前，首先要考察数据是否存在空间依赖性。

如果不存在，则使用标准的计量方法即可；

如果存在，则可使用空间计量方法。

比照时间序列（timeseries），空间数据有时也称为“空间序列”（spatialseries）。

时间序列可视为在时间轴上分布的随机过程，而空间数据（序列）则为在空间分布的随机过程。

时间序列的一个重要特性是可能存在自相关，特别是一阶自相关。

对于空间序列，自相关的情形则更为复杂；

因为时间序列只可能在一个方向上相关（过去影响现在，但现在无法影响过去），而空间序列则可以在多个方向上相关，而且可以互相影响（xi影响xj，而xj也影响xi）。

“空间自相关”（spatialautocorrelation）可理解为位置相近的区域具有相似的变量取值。

如果高值与高值聚集在一起，低值与低值聚集在一起，则为“正空间自相关”（positivespatialautocorrelation）。

如果高值与低值相邻，则为“负空间自相关”（negativespatialautocorrelation）；

较少见。

如果高值与低值完全随机地分布，则不存在空间自相关。

考虑空间序列{x}n。

文献中提出了一系列度量空间自相关的方法，最为流行的是“莫兰指数I”（Moran’sI）：

∑∑wij（xi

x）（xj

x）

I=i=1

j=1

S∑∑w

i=1j=1

∑

其中，S2=

ni=1

（xin

-x）2

为样本方差，wij为空间权重矩阵的（i,j）

元素（用来度量区域i与区域j之间的距离），而∑∑wij为所有空间

权重之和。

i=1

如果空间权重矩阵为行标准化，则∑∑wij

=n，莫兰指数I为：

x）（xj

I=i=1j=1

∑（xi

莫兰指数I的取值一般介于-1到1之间，大于0表示正自相关，即高值与高值相邻、低值与低值相邻；

小于0表示负自相关，即高值与低值相邻。

如果莫兰指数I接近于0，则表明空间分布是随机的，不存在空间自相关。

莫兰指数I可视为观测值与其空间滞后（spatiallag）的相关系数。

如果将观测值与其空间滞后画成散点图，称为“莫兰散点图”

（Moranscatterplot），则莫兰指数I就是该散点图回归线的斜率。

考虑原假设“H0:

Cov（xi,

xj）=0,

∀i≠

j”（即不存在空间自相关）。

在此原假设下，莫兰指数I的期望值为

E（I）=

-1

n-1

莫兰指数I的方差表达式更为复杂，记为Var（I）。

标准化的莫兰指数I服从渐近标准正态分布：

I*≡

I-E（I）

−d−→N（0,1）

在使用莫兰指数I检验空间自相关时，须注意两个问题。

问题之一，莫兰指数I取决于空间矩阵W，如果空间矩阵设定不正确，则可能导致错误的结果。

问题之二，莫兰指数I的核心成分为（xi

x），其隐含假设

是{x}

的期望值为常数（constantmean），不存在任何趋势（trend）。

如果存在趋势，则可能导致检验结果出现偏差。

为了解决问题一，须仔细选择合适的空间矩阵，或使用不同的空间矩阵以考察结果的稳健性。

为了解决问题二，可引入协变量，通过回归的方法去掉趋势，然后对残差项进行莫兰指数I检验。

以上的莫兰指数I也被称为“全局莫兰指数I”（globalMoran’sI），

考察整个空间序列{x}n

的空间集聚情况。

如果想知道某区域i附近的空间集聚情况，可使用“局部莫兰指数I”（localMoran’sI）：

（xi-x）n

Ii=

2∑wij（xj

局部莫兰指数I的含义与全局莫兰指数I相似。

莫兰指数I并非唯一的空间自相关指标，另一常用指标为“吉尔里指数C”（Geary’sC）（Geary,1954），也称为“吉尔里相邻比率”（Geary’sContiguityRatio）：

（n-1）∑∑w（x

C=⎛

⎫⎡

ijij

⎤

2ç

∑∑wij⎪⎢∑（xi

-x）⎥

⎝i=1

⎭⎣i=1⎦

吉尔里指数C的核心成分为（x-x）2。

吉尔里指数C的取值一般介于0到2之间（2不是严格上界），大于1表示负相关，等于1表示不相关，而小于1表示正相关。

吉尔里指数C与莫兰指数I呈反向变动；

前者比后者对于局部空间自相关更为敏感。

在不存在空间自相关的原假设下，吉尔里指数C的期望值为1，而方差的表达式较复杂，记为Var（C）。

标准化的吉尔里指数C服从渐近标准正态分布：

C*≡

C-1

莫兰指数I与吉尔里指数C的共同缺点在于，即无法分别“热点”（hotspot）与“冷点”（coldspot）区域。

所谓热点区域，即高值与高值聚集的区域；

而冷点区域则是低值与低值聚集的区域。

热点区域与冷点区域都表现为正自相关。

GetisandOrd（1992）提出了以下“Getis-Ord指数G”：

∑∑wijxixj

G=i=1j=1

∑∑xixj

i=1j≠i

其中，xi

∀i；

而wij来自非标准化的对称空间权重矩阵，且

所有元素均为0或1。

如果样本中高值聚集在一起，则G较大；

如果低值聚集在一起，则G较小。

∑∑wij

在无空间自相关的原假设下，E（G）=

i=1j≠i。

n（n-1）

如果G值大于此期望值，则表示存在热点区域；

如果G值小于此期望值，则表示存在冷点区域。

标准化的G服从渐近标准正态分布：

G*≡

G-E（G）

如果G*>

1.96，则可在5%水平上拒绝无空间自相关的原假设，

认为存在空间正自相关，且存在热点区域。

如果G*<

-1.96，则可在5%水平上拒绝无空间自相关的原假设，

认为存在空间正自相关，且存在冷点区域。

如果要考察某区域i是否为热点或冷点，则可使用“局部

Getis-Ord指数G”：

Gi=

∑wijxjj≠i

∑x

j≠i

以上各种空间自相关指标仅提供是否存在空间效应的初步检验，深入检验有赖于建立正式的空间计量模型。

29.4空间自回归模型

对于时间序列，最常见的建模方式为一阶自回归AR

（1）。

空间自回归的形式更为复杂，因为空间滞后可以来自不同的方向，而且可以双向。

对于空间序列{y}n

（样本容量为n），即使假设空间自相关的形

式为线性，待估计的参数在理论上最多可达（n2-n）个（每个区域最

多可受n-1个区域影响，共有n个区域），大大超出样本容量。

必须假设空间依赖性服从某种共同的模式，才能简化参数。

首先回顾时间序列的一阶自相关模型：

yt=

βyt-1+εt

（t=2,,n）

假设n=4，而y1=ε1。

将这4个方程叠放在一起可得：

⎛y1⎫

⎛0000⎫⎛

y1⎫⎛ε1⎫

y=ç

2⎪=

1000⎪ç

βç

⎪ç

2⎪+ç

2⎪≡

βWy+ε

y3⎪

0100⎪ç

y3⎪ç

ε3⎪

⎝4⎭

0010⎪ç

⎝⎭⎝

4⎭⎝4⎭

其中，矩阵W的次主对角线元素均为1，而其他元素都为0。

矩阵W可视为“时间滞后矩阵”，它之所以呈现出次对角线元素为1而其他元素为0的规律性排列，正是由于时间滞后在方向上的单一性。

对于空间序列，矩阵W则为空间权重矩阵，其元素排列方式表现出多样性（因为空间自相关可以多方向）。

引入以下“空间自回归模型”（SpatialAutoregression，简记SAR）：

y=λWy+ε

其中，W为已知的空间权重矩阵（非随机），而空间依赖性仅由单一参数λ。

λ度量空间滞后Wy对y的影响，称为“空间自回归系数”（spatialautoregressiveparameter）。

此模型也称为“空间滞后模型”（SpatialLagModel）。

相邻地区的被解释变量（比如犯罪率）可能相互依赖，并最终形成一个均衡的结果。

又比如，假设以地区税收为被解释变量，则不同地区的政府出于相互竞争或博弈的考虑（比如，竞相吸引FDI），在制定本地区税收时，会考虑周边地区的税收水平。

假设W为前例的权重矩阵，则方程可写为：

⎛0111⎫⎛

⎛y2+

y3+

y4⎫

⎛ε1⎫

y⎪

1010⎪ç

ε⎪

y+y

2⎪=λç

13⎪+ç

2⎪

1101⎪ç

y1+y2+

y4⎪ç

⎝13

⎭⎝4⎭

如果对此联立方程系统进行OLS估计，将导致联立方程偏差

（simultaneitybias）。

由于空间依赖性，导致变量{y}n

之间互相影响，产生内生性。

更一般地，可在方程中加入自变量：

y=λWy+Xβ+ε

其中，X为n⨯k数据矩阵，包括k列解释变量；

βk⨯1为相应系数。

此方程也称为SAR模型。

如果λ=0，则简化为一般的线性回归模型。

可通过检验原假设“H0:

λ=0”来考察是否存在空间效应。

对于空间自回归模型，常使用MLE估计。

首先，假设扰动项ε~

N（0,σ2I）。

其次，方程可写为

≡（I

-λW）y=

Xβ+ε

其中，A≡（I-λW）。

由于雅可比行列式J≡=

==A'

A，根据

多维正态密度公式，可写出样本的似然函数：

L（y|λ,σ2,β）=（2πσ2）-n

2（abs

A）exp⎧-

2σ2

（Ay-

Xβ）'

Xβ）⎫

⎨

⎬

⎩⎭

其中，abs

A表示行列式

A的绝对值。

对数似然函数为：

lnL（y|λ,σ2,β）=-nln2π-nlnσ2+ln（absA）-1（Ay-

Xβ）

222σ2

此最大化问题分两步。

第一步，在给定λ的情况下，选择最优的β,σ2。

第二步，代入第一步的最优β,σ2，选择最优的λ。

在第一步，由于β只出现于最后一项，故等价于使

Xβ）最小，即Ay对X进行回归：

βˆ=（X'

X）-1X'

=（X'

（I

λW）y

y-λ（X'

Wy≡

ˆ-λβˆL

其中，

ˆ≡（X'

（y对X的回归系数），而

βˆL

≡（X'

Wy（Wy对X的回归系数）。

只要知道λ，即可计算βˆ。

对σ2求偏导可得σ2的MLE估计：

σˆ2

=e'

（MXAy）'

（MXAy）

其中，e为Ay对X回归的残差向量，MX

灭矩阵。

≡In

-X（X'

为消

由于Ay

=（I

λW）y，故

e=MXAy=

MX（I

MXy-λMXWy

≡e0

λeL

其中，e0

≡MX

y（y对X的回归残差），而eL

≡MXWy（Wy对X的

回归残差）。

代入可得：

（e0

-λeL）'

λeL）

只要知道λ，即可计算σˆ2。

在第二步，将βˆ（λ）,σˆ2（λ）代入对数似然函数，可得“集中对数

似然函数”（concentratedloglikelihoodfunction），它只是λ的函数。

由于λ出现在行列式A=

I-λW

，给计算带来不便。

可利用等式A

=∏（1-λvi）来计算，其中v1,,vn为矩阵A特征值

（eigenvalues）。

为保证扰动项协方差矩阵为正定，还须限制λ的取值为

λ<

1，其中v与v分别为矩阵A的最小与最大特征值，

vminvmax

而vmin一定为负数。

min

max

对于MLE估计量的渐近协方差矩阵，通过信息矩阵来估计：

⎪⎧⎡∂2lnL⎤⎫⎪-1

I（θ）-1

≡-⎨E⎢⎥⎬

⎩⎪⎣∂θ∂θ'

⎦⎭⎪

其中，θ=（λ,σ2,β）。

对于空间自回归模型y

=λWy+

Xβ+ε，解释变量X对y的边际

效应并非β，因为X对y产生作

展开阅读全文