第29章空间计量经济学.docx

资源描述

第29章空间计量经济学.docx

《第29章空间计量经济学.docx》由会员分享，可在线阅读，更多相关《第29章空间计量经济学.docx（39页珍藏版）》请在冰豆网上搜索。

第29章空间计量经济学.docx

第29章空间计量经济学

©陈强,《高级计量经济学及Stata应用》课件，第二版，2014年，高等教育出版社。

第29章空间计量经济学

29.1地理学第一定律

许多经济数据都涉及一定的空间位置。

比如，研究全国各省的

GDP、投资、贸易、R&D等数据。

此前各章很少关注各省经济之间的互动，通常假设各省的变量相互独立。

但各省经济有着广泛的联系，而且越近的省份联系越密切。

根据Tobler（1970），“所有事物都与其他事物相关联，但较近的事物比较远的事物更关联”（Everythingisrelatedtoeverythingelse,butnearthingsaremorerelatedthandistantthings）。

这被称为“地理学第一定律”（FirstLawofGeography）。

各省之间的距离信息并不难获得，比如是否相邻，直线距离或运输距离。

将各省的变量数据，再加上各省的位置信息（或相互距离），即可得到“空间数据”（spatialdata或arealdata）。

研究如何处理空间数据的计量经济学分支，称为“空间计量经济学”（spatialeconometrics）。

空间计量经济学的最大特色在于充分考虑横截面单位之间的空间依赖性（spatialdependence）。

空间效应（spatialeffects）包括空间依赖性与“空间异质性”（spatialheterogeneity）。

由于标准的计量经济学也考虑横截面单位之间的异质性（比如异方差），故空间计量经济学的关注重点为空间依赖性。

空间计量经济学诞生于1970年代。

近年来，空间计量经济学蓬勃发展并进入主流，可归功于两方面。

首先，由于GIS（地理信息系统）的发展，空间数据或包含地理信息的数据（geo-referenceddata）日益增多。

其次，在经济理论方面，人们越来越关注经济行为人之间的互动，而不仅仅停留于代表性厂商或个人。

比如，在考察同伴效应（peereffect），相邻效应（neighborhoodeffect），溢出效应（spillovereffect）或网络效应（networkeffect）时，都需要明确地考虑空间因素。

29.2空间权重矩阵

进行空间计量分析的前提是度量区域之间的空间距离。

ii=1

记来自n个区域的空间数据为{x}n

，下标i表示区域i。

记区域

i与区域j之间的距离为wij，则可定义“空间权重矩阵”（spatialweightingmatrix）如下：

⎛w11w1n⎫

W=ç⎪

ç⎪

çww⎪

⎝n1nn⎭

其中，主对角线上元素w11

wnn

=0（同一区域的距离为0）。

空间权重矩阵W为对称矩阵。

最常用的距离函数为“相邻”（contiguity），即如果区域i与区域j

有共同的边界，则wij

=1；反之，则wij

=0。

比照（国际）象棋中棋子的行走路线，相邻关系可分为以下几种：

（1）车相邻（rookcontiguity）：

两个相邻区域有共同的边。

（2）象相邻（bishopcontiguity）：

两个相邻区域有共同的顶点，但没有共同的边。

（3）后相邻（queencontiguity）：

两个相邻区域有共同的边或顶点。

车相邻象相邻后相邻

图29.1常用相邻关系

在实践中，为了区分“边”与“点”，须设定一个最小距离，在此距离以下为点，而在此距离以上为边。

究竟使用车、象或后相邻，取决于具体情况。

比如，区域i与区域j仅在一点相交（象相邻），但有一条主要高速公路通过此点连接两区域，则不宜使用车相邻。

假设有如下四个区域，其变量取值分别为x

=（x1x2

x3x4）'。

图29.2假想的四个区域

其空间权重矩阵为：

⎛0

ç1

=ç

ç1

ç10

⎝

1⎫

⎪

W⎪

1⎪

⎪

⎭

第一行表示，区域1与其余三个区域均相邻；第二行表示，区

域2与区域1、区域3相邻，但不与区域4相邻；以此类推。

空间权重矩阵考虑的是一阶邻居，还可以考虑二阶邻居，即邻居的邻居，可用矩阵W2来表示。

矩阵W2的主对角线上元素一般不再为0，这意味着邻居的邻居也包括自己。

实践中，有时对空间权重矩阵进行“行标准化”（rowstandardization），即将矩阵中的每个元素（记为wij）除以其所在行元素之和，以保证每行元素之和为1：

wij

≡∑w

如果区域i为孤岛，与其他区域均不相邻，则上式分母为0，并不适用；可将分母改为max（1,∑wij）。

不包含孤岛的行标准化矩阵也称为“行随机矩阵”（row-stochasticmatrix），所有元素均介于0与1之间，且每行元素之和为1，在形式上与离散型概率分布一样。

将前面的空间权重矩阵行标准化可得（仍记为W）：

⎛0131313⎫

ç120120⎪

W=ç⎪

ç1313013⎪

ç120120⎪



⎝⎭

行标准化的好处在于，如果将行标准化矩阵W乘以x，则可得到每个区域邻居的平均值。

在上例中：

⎛0131313⎫⎛x1⎫

⎡（x2+x3

+x4）3⎤

ç12

ç13

⎪çx⎪

⎢（x

+x）2⎥

Wx=

⎪ç2⎪=⎢13⎥

3⎪çx3⎪⎢（x1+x2+x4）3⎥

ç120120

⎪çx⎪

⎢（x

+x）2⎥

⎝⎭⎝4⎭⎣13⎦

比如，区域1的邻居为区域2，3和4，而上式右边第一行元素

正好为（x2

x4）3，即区域1邻居的平均值；以此类推。

比照时间序列中时间滞后（timelag）的概念，Wx也被称为x的“空间滞后”（spatiallag），即x邻居的平均取值。

行标准化之后的空间权重矩阵一般不再是对称矩阵，这是它的缺陷之一。

由于每行元素之和均为1，这意味着区域i所受其邻居的影响之

和一定等于区域j所受其邻居的影响之和（任意i≠

过强，这是行标准化的另一局限。

j）；此假定可能

定义相邻关系的另一方法基于区域间的距离。

记区域i与区域j的距离为dij，可定义空间权重如下：

wij

=⎧1

⎨0

⎩

若dij

若dij≥d

其中，d为事先给定的距离临界值。

也可直接以距离之倒数（inversedistance）作为空间权重：

wij=d

在上式中，距离dij既可以是地理距离，比如直线距离或大圆距

离（greatcircledistance）；也可以是基于运输成本或旅行时间的经济距离；甚至社交网络中的距离。

例：

林光平等（2005）使用基于地理相邻关系的简单权重矩阵W来研究我国28个省市在1978-2002年期间实际人均GDP的收敛情况。

但相邻地区经济上的相互关系并不完全相同。

为此，林光平等（2005）使用地区间人均GDP的差额作为测度地

区间“经济距离”的指标，并引入经济空间权重矩阵W*=W⨯E，

其中矩阵E的主对角线元素均为0，非主对角线的（i,j）元素为

Eij=

1（i≠

j），Yi为地区i样本期间的人均实际GDP平均值。

29.3空间自相关

在使用空间计量方法前，首先要考察数据是否存在空间依赖性。

如果不存在，则使用标准的计量方法即可；

如果存在，则可使用空间计量方法。

比照时间序列（timeseries），空间数据有时也称为“空间序列”（spatialseries）。

时间序列可视为在时间轴上分布的随机过程，而空间数据（序列）则为在空间分布的随机过程。

时间序列的一个重要特性是可能存在自相关，特别是一阶自相关。

对于空间序列，自相关的情形则更为复杂；因为时间序列只可能在一个方向上相关（过去影响现在，但现在无法影响过去），而空间序列则可以在多个方向上相关，而且可以互相影响（xi影响xj，而xj也影响xi）。

“空间自相关”（spatialautocorrelation）可理解为位置相近的区域具有相似的变量取值。

如果高值与高值聚集在一起，低值与低值聚集在一起，则为“正空间自相关”（positivespatialautocorrelation）。

如果高值与低值相邻，则为“负空间自相关”（negativespatialautocorrelation）；较少见。

如果高值与低值完全随机地分布，则不存在空间自相关。

ii=1

考虑空间序列{x}n。

文献中提出了一系列度量空间自相关的方法，最为流行的是“莫兰指数I”（Moran’sI）：

∑∑wij（xi

x）（xj

x）

I=i=1

j=1

S∑∑w

i=1j=1

∑

其中，S2=

ni=1

（xin

-x）2

为样本方差，wij为空间权重矩阵的（i,j）

元素（用来度量区域i与区域j之间的距离），而∑∑wij为所有空间

权重之和。

i=1

j=1

如果空间权重矩阵为行标准化，则∑∑wij

=n，莫兰指数I为：

i=1j=1

∑∑wij（xi

x）（xj

x）

I=i=1j=1

∑（xi

-x）2

i=1

莫兰指数I的取值一般介于-1到1之间，大于0表示正自相关，即高值与高值相邻、低值与低值相邻；小于0表示负自相关，即高值与低值相邻。

如果莫兰指数I接近于0，则表明空间分布是随机的，不存在空间自相关。

莫兰指数I可视为观测值与其空间滞后（spatiallag）的相关系数。

如果将观测值与其空间滞后画成散点图，称为“莫兰散点图”

（Moranscatterplot），则莫兰指数I就是该散点图回归线的斜率。

考虑原假设“H0:

Cov（xi,

xj）=0,

∀i≠

j”（即不存在空间自相关）。

在此原假设下，莫兰指数I的期望值为

E（I）=

-1

n-1

莫兰指数I的方差表达式更为复杂，记为Var（I）。

标准化的莫兰指数I服从渐近标准正态分布：

I*≡

I-E（I）

−d−→N（0,1）

在使用莫兰指数I检验空间自相关时，须注意两个问题。

问题之一，莫兰指数I取决于空间矩阵W，如果空间矩阵设定不正确，则可能导致错误的结果。

问题之二，莫兰指数I的核心成分为（xi

x）（xj

x），其隐含假设

是{x}

ii=1

的期望值为常数（constantmean），不存在任何趋势（trend）。

如果存在趋势，则可能导致检验结果出现偏差。

为了解决问题一，须仔细选择合适的空间矩阵，或使用不同的空间矩阵以考察结果的稳健性。

为了解决问题二，可引入协变量，通过回归的方法去掉趋势，然后对残差项进行莫兰指数I检验。

以上的莫兰指数I也被称为“全局莫兰指数I”（globalMoran’sI），

ii=1

考察整个空间序列{x}n

的空间集聚情况。

如果想知道某区域i附近的空间集聚情况，可使用“局部莫兰指数I”（localMoran’sI）：

（xi-x）n

Ii=

2∑wij（xj

j=1

x）

局部莫兰指数I的含义与全局莫兰指数I相似。

莫兰指数I并非唯一的空间自相关指标，另一常用指标为“吉尔里指数C”（Geary’sC）（Geary,1954），也称为“吉尔里相邻比率”（Geary’sContiguityRatio）：

（n-1）∑∑w（x

-x）2

C=⎛

i=1

j=1

⎫⎡

ijij

⎤

2ç∑∑wij⎪⎢∑（xi

-x）⎥

⎝i=1

j=1

⎭⎣i=1⎦

吉尔里指数C的核心成分为（x-x）2。

吉尔里指数C的取值一般介于0到2之间（2不是严格上界），大于1表示负相关，等于1表示不相关，而小于1表示正相关。

吉尔里指数C与莫兰指数I呈反向变动；前者比后者对于局部空间自相关更为敏感。

在不存在空间自相关的原假设下，吉尔里指数C的期望值为1，而方差的表达式较复杂，记为Var（C）。

标准化的吉尔里指数C服从渐近标准正态分布：

C*≡

C-1

−d−→N（0,1）

莫兰指数I与吉尔里指数C的共同缺点在于，即无法分别“热点”（hotspot）与“冷点”（coldspot）区域。

所谓热点区域，即高值与高值聚集的区域；而冷点区域则是低值与低值聚集的区域。

热点区域与冷点区域都表现为正自相关。

GetisandOrd（1992）提出了以下“Getis-Ord指数G”：

∑∑wijxixj

G=i=1j=1

∑∑xixj

i=1j≠i

其中，xi

>0,

∀i；而wij来自非标准化的对称空间权重矩阵，且

所有元素均为0或1。

如果样本中高值聚集在一起，则G较大；如果低值聚集在一起，则G较小。

∑∑wij

在无空间自相关的原假设下，E（G）=

i=1j≠i。

n（n-1）

如果G值大于此期望值，则表示存在热点区域；如果G值小于此期望值，则表示存在冷点区域。

标准化的G服从渐近标准正态分布：

G*≡

G-E（G）

−d−→N（0,1）

如果G*>1.96，则可在5%水平上拒绝无空间自相关的原假设，

认为存在空间正自相关，且存在热点区域。

如果G*<-1.96，则可在5%水平上拒绝无空间自相关的原假设，

认为存在空间正自相关，且存在冷点区域。

如果要考察某区域i是否为热点或冷点，则可使用“局部

Getis-Ord指数G”：

Gi=

∑wijxjj≠i

∑x

j≠i

以上各种空间自相关指标仅提供是否存在空间效应的初步检验，深入检验有赖于建立正式的空间计量模型。

29.4空间自回归模型

对于时间序列，最常见的建模方式为一阶自回归AR

（1）。

空间自回归的形式更为复杂，因为空间滞后可以来自不同的方向，而且可以双向。

ii=1

对于空间序列{y}n

（样本容量为n），即使假设空间自相关的形

式为线性，待估计的参数在理论上最多可达（n2-n）个（每个区域最

多可受n-1个区域影响，共有n个区域），大大超出样本容量。

必须假设空间依赖性服从某种共同的模式，才能简化参数。

首先回顾时间序列的一阶自相关模型：

yt=

βyt-1+εt

（t=2,,n）

假设n=4，而y1=ε1。

将这4个方程叠放在一起可得：

⎛y1⎫

⎛0000⎫⎛

y1⎫⎛ε1⎫

çy

y=ç

⎪

2⎪=

ç1000⎪çy

βç⎪ç

⎪ç

2⎪+ç

⎪

2⎪≡

βWy+ε

çy3⎪

ç0100⎪çy3⎪çε3⎪

ç⎪

⎝4⎭

ç0010⎪çy

⎝⎭⎝

⎪ç⎪

4⎭⎝4⎭

其中，矩阵W的次主对角线元素均为1，而其他元素都为0。

矩阵W可视为“时间滞后矩阵”，它之所以呈现出次对角线元素为1而其他元素为0的规律性排列，正是由于时间滞后在方向上的单一性。

对于空间序列，矩阵W则为空间权重矩阵，其元素排列方式表现出多样性（因为空间自相关可以多方向）。

引入以下“空间自回归模型”（SpatialAutoregression，简记SAR）：

y=λWy+ε

其中，W为已知的空间权重矩阵（非随机），而空间依赖性仅由单一参数λ。

λ度量空间滞后Wy对y的影响，称为“空间自回归系数”（spatialautoregressiveparameter）。

此模型也称为“空间滞后模型”（SpatialLagModel）。

相邻地区的被解释变量（比如犯罪率）可能相互依赖，并最终形成一个均衡的结果。

又比如，假设以地区税收为被解释变量，则不同地区的政府出于相互竞争或博弈的考虑（比如，竞相吸引FDI），在制定本地区税收时，会考虑周边地区的税收水平。

假设W为前例的权重矩阵，则方程可写为：

⎛y1⎫

⎛0111⎫⎛

y1⎫⎛ε1⎫

⎛y2+

y3+

y4⎫

⎛ε1⎫

çy⎪

ç1010⎪çy

⎪çε⎪

çy+y

⎪çε⎪

ç2⎪=λç⎪ç

2⎪+ç

2⎪=λç

13⎪+ç2⎪

çy3⎪

ç1101⎪çy3⎪çε3⎪

çy1+y2+

y4⎪çε3⎪

çy⎪

ç1010⎪çy

⎪çε⎪

çy+y

⎪çε⎪

⎝4⎭

⎝⎭⎝

4⎭⎝4⎭

⎝13

⎭⎝4⎭

如果对此联立方程系统进行OLS估计，将导致联立方程偏差

（simultaneitybias）。

ii=1

由于空间依赖性，导致变量{y}n

之间互相影响，产生内生性。

更一般地，可在方程中加入自变量：

y=λWy+Xβ+ε

其中，X为n⨯k数据矩阵，包括k列解释变量；βk⨯1为相应系数。

此方程也称为SAR模型。

如果λ=0，则简化为一般的线性回归模型。

可通过检验原假设“H0:

λ=0”来考察是否存在空间效应。

对于空间自回归模型，常使用MLE估计。

首先，假设扰动项ε~

N（0,σ2I）。

其次，方程可写为

≡（I

-λW）y=

Xβ+ε

其中，A≡（I-λW）。

由于雅可比行列式J≡=

==A'=

A，根据

多维正态密度公式，可写出样本的似然函数：

L（y|λ,σ2,β）=（2πσ2）-n

2（abs

A）exp⎧-

2σ2

（Ay-

Xβ）'（Ay-

Xβ）⎫

⎨

⎬

⎩⎭

其中，abs

A表示行列式

A的绝对值。

对数似然函数为：

lnL（y|λ,σ2,β）=-nln2π-nlnσ2+ln（absA）-1（Ay-



Xβ）'（Ay-

Xβ）

222σ2

此最大化问题分两步。

第一步，在给定λ的情况下，选择最优的β,σ2。

第二步，代入第一步的最优β,σ2，选择最优的λ。

在第一步，由于β只出现于最后一项，故等价于使

（Ay-

Xβ）'（Ay-

Xβ）最小，即Ay对X进行回归：

βˆ=（X'X）-1X'Ay

=（X'X）-1X'（I

λW）y

=（X'X）-1X'y-λ（X'X）-1X'Wy≡

ˆ-λβˆL

其中，

ˆ≡（X'X）-1X'y

（y对X的回归系数），而

βˆL

≡（X'X）-1X'Wy（Wy对X的回归系数）。

只要知道λ，即可计算βˆ。

对σ2求偏导可得σ2的MLE估计：

σˆ2

=e'e=

（MXAy）'（MXAy）

其中，e为Ay对X回归的残差向量，MX

灭矩阵。

≡In

-X（X'X）-1X'为消

由于Ay

=（I

λW）y，故

e=MXAy=

MX（I

-λW）y=

MXy-λMXWy

≡e0

λeL

其中，e0

≡MX

y（y对X的回归残差），而eL

≡MXWy（Wy对X的

回归残差）。

代入可得：

σˆ2

=e'e=

（e0

-λeL）'（e0

λeL）

只要知道λ，即可计算σˆ2。

在第二步，将βˆ（λ）,σˆ2（λ）代入对数似然函数，可得“集中对数

似然函数”（concentratedloglikelihoodfunction），它只是λ的函数。

由于λ出现在行列式A=

I-λW

，给计算带来不便。

可利用等式A

=∏（1-λvi）来计算，其中v1,,vn为矩阵A特征值

i=1

（eigenvalues）。

为保证扰动项协方差矩阵为正定，还须限制λ的取值为

1<λ<1，其中v与v分别为矩阵A的最小与最大特征值，

vminvmax

而vmin一定为负数。

min

max

对于MLE估计量的渐近协方差矩阵，通过信息矩阵来估计：

⎪⎧⎡∂2lnL⎤⎫⎪-1

I（θ）-1

≡-⎨E⎢⎥⎬

⎩⎪⎣∂θ∂θ'⎦⎭⎪

其中，θ=（λ,σ2,β）。

对于空间自回归模型y

=λWy+

Xβ+ε，解释变量X对y的边际

效应并非β，因为X对y产生作

展开阅读全文