第5节 地理数据分布的集中化与均衡度指数.docx

上传人:b****4 文档编号:12073730 上传时间:2023-04-16 格式:DOCX 页数:17 大小:139.25KB
下载 相关 举报
第5节 地理数据分布的集中化与均衡度指数.docx_第1页
第1页 / 共17页
第5节 地理数据分布的集中化与均衡度指数.docx_第2页
第2页 / 共17页
第5节 地理数据分布的集中化与均衡度指数.docx_第3页
第3页 / 共17页
第5节 地理数据分布的集中化与均衡度指数.docx_第4页
第4页 / 共17页
第5节 地理数据分布的集中化与均衡度指数.docx_第5页
第5页 / 共17页
点击查看更多>>
下载资源
资源描述

第5节 地理数据分布的集中化与均衡度指数.docx

《第5节 地理数据分布的集中化与均衡度指数.docx》由会员分享,可在线阅读,更多相关《第5节 地理数据分布的集中化与均衡度指数.docx(17页珍藏版)》请在冰豆网上搜索。

第5节 地理数据分布的集中化与均衡度指数.docx

第5节地理数据分布的集中化与均衡度指数

 

第5节地理数据分布的集中化与均衡度指数

地理现象的分布格局,常常用地理数据分布的集中化程度与均衡度来描述。

为了揭示某种地理现象分布的基本格局,常常需要计算相关地理数据分布的集中化和均衡度指数。

一、罗伦次曲线与集中化指数

(1)罗伦次曲线

20世纪初,意大利统计学家罗伦次(M.Lorenz),首先使用累计频率曲线研究工业化的集中化程度。

后来,这种曲线就被称之为罗伦次曲线。

下面我们通过实例,说明罗伦次曲线的做法和集中化指数的计算方法。

表2.5.1某地区农户家庭经营性纯收入水平及其构成

部门代码

产业部门

2004

1999

收入(元)

占总收入的比重(%)

收入(元)

占总收入的比重(%)

1

种植业

2735.93

42.82

1645.53

56.73

2

林业

143.57

2.25

79.66

2.75

3

畜牧业

660.61

10.34

390.24

13.45

4

渔业

220.67

3.45

74.12

2.56

5

工业

441.57

6.91

167.38

5.77

6

建筑业

163.95

2.57

44.55

1.54

7

运输业

516.87

8.09

150.88

5.20

8

商饮服务业

1112.72

17.42

211.62

7.30

9

其它

393.16

6.15

136.7

4.71

合计

家庭经营纯收入

6389.05

100

2900.68

100

表2.5.1描述了某地区农户家庭经营性纯收入水平及其构成情况。

为了形象、直观地描述农户家庭经营性纯收入在某些产业部门的集中化程度,可以按照以下步骤绘制罗伦次曲线:

(1)将各产业部门的收入及其占总收入比重(百分比),从大到小重新排序;

(2)从大到小,逐次计算累计百分比,得到表2.5.2和表2.5.3;

(3)以自然序号为横坐标(x),累计百分比为纵坐标(y);以(部门代码,累计百分比)为坐标点,连成一个上凸的曲线(图2.5.1和图2.5.2),即罗伦次曲线。

这里,要求作图时,将纵坐标轴和横坐标轴取成相等长度,使整个绘图区成正方形。

罗伦次曲线的上凸程度,就表示农户家庭经营性纯收入的部门集中化程度。

上凸程度越大,就表示农户家庭经营性纯收入越是集中于某些产业部门。

如果各个产业部门的收入是均等的,则罗伦次曲线正好就变成了正方形的对角线。

比较图2.5.1和图2.5.2,从罗伦次曲线的上凸程度可以看出,该地区1999年农户家庭经营性纯收入的部门集中化程度高于2004年。

罗伦次曲线,不但可以按部门,而且也可以按空间(地区),形象、直观地描述要素分布在地域空间上的集中化程度。

如果按照部门构成,绘制出不同时期某要素数据分布的罗伦次曲线,就可以比较、分析不同时期该要素在部门之间分布的集中化程度;同样,对于一个特定的时期,如果按照空间(地区)构成,绘制出某要素数据分布的罗伦次曲线,就可以描述该时期该要素在地域空间上分布的集中化程度。

表2.5.21999年农户家庭经营性纯收入大小排序的各部门比例及累计百分比

自然序号

部门代码

产业部门

收入(元)

占总收入的比重(%)

累计百分比(%)

1

1

种植业

1645.53

56.73

56.73

2

3

畜牧业

390.24

13.45

70.18

3

8

商饮服务业

211.62

7.30

77.48

4

5

工业

167.38

5.77

83.25

5

7

运输业

150.88

5.20

88.45

6

9

其它

136.7

4.71

93.16

7

2

林业

79.66

2.75

95.91

8

4

渔业

74.12

2.56

98.47

9

6

建筑业

44.55

1.54

100.00

表2.5.32004年农户家庭经营性纯收入大小排序的各部门比例及累计百分比

自然序号

部门代码

产业部门

收入(元)

占总收入的比重(%)

累计百分比(%)

1

1

种植业

2735.93

42.82

42.82

2

8

商饮服务业

1112.72

17.42

60.24

3

3

畜牧业

660.61

10.34

70.58

4

7

运输业

516.87

8.09

78.67

5

5

工业

441.57

6.91

85.58

6

9

其它

393.16

6.15

91.73

7

4

渔业

220.67

3.45

95.18

8

6

建筑业

163.95

2.57

97.75

9

2

林业

143.57

2.25

100.00

图2.5.11999年农户家庭经营性纯收入构成的罗伦次曲线

图2.5.22004年农户家庭经营性纯收入构成的罗伦次曲线

(2)集中化指数

集中化指数,是一个描述地理数据分布的集中化程度的指数。

假若罗伦次曲线的解析式为:

(2.5.1)

显然,该曲线下方区域的面积为:

(2.5.2)

当数据均匀分布时,A就变成了对角线以下三角形的面积(R);当数据集中于一点时,A就变成了整个正方形的面积(M)。

构造如下指数:

(2.5.3)

显然,I越大,就说明数据分布的集中化程度越高;反之,I越小,就说明数据分布的集中化程度越低(越均衡)。

这个指数I,就被称为集中化指数。

在实际应用中,由于难以得到罗伦次曲线函数的解析式,因而无法用公式(2.5.2)计算面积A。

故,常常采用如下近似取值方法,即:

A——实际数据的累计百分比总和;

R——均匀分布时的累计百分比总和;

M——集中分布时的累计百分比总和。

由(2.5.3)式可以看出,当地理数据集中分布于一点时,A=M,所以I=1;当地理数据均匀分布时,A=R,所以I=0。

也就是说,集中化指数在[0,1]区间上取值。

可见,通过计算集中化指数,可以定量化的比较地理数据分布的集中化程度。

但是,这里需要强调说明的是,只有数据的个数相同而且横坐标划分一致时,才有可比性。

例如,根据表2.5.2中的数据,用(2.5.3)式,可以计算某地区1999年农户家庭经营性纯收入构成的集中化指数:

同样,根据以表2.5.3中的数据,用(2.5.3)式,也可以计算某地区2004年农户家庭经营性纯收入构成的集中化指数:

从计算结果可以看出,与1999年相比,2004年某地区农户家庭经营性纯收入构成的集中化指数降低了10.27。

也就是说,与1999年相比,2004年某地区农户家庭经营性纯收入构成的集中化程度降低了,而均衡度增加了。

这一结论正好印证了上述从罗伦次曲线的初步判断。

二、基尼系数

虽然我们可以使用罗伦次曲线和集中化指数描述一组数据分布的集中化程度,但是,对于经济发展、收入分配等均衡(不均衡)状况,往往需要通过对两组数据的对比分析,才能得到更为客观的结论。

基尼系数(Ginicoefficient),就是通过两组数据的对比分析,纵、横坐标均以累计百分比表示,从而做出罗伦次曲线,然后再计算得出的集中化指数。

它是通过对人口和收入两组数据进行比较分析,然后将纵、横坐标均以累计百分比表示,作出罗伦次曲线,再计算集中化指数而得到的一个判断收入分配不平等程度的指标。

基尼系数,是意大利经济学家基尼(C.Gini)于20世纪初首先提出来的。

其原理方法如下:

列出每一个区域(部门)的人口与收入占全区(各部门总计)的比重p与w;

计算每一区域(部门)的比率w/p;

根据w/p值,由小到大将每一地区(部门)排序;

按照上述顺序分别计算p和w的累计值X和Y;

以X为横坐标,以Y为纵坐标,在直角坐标系中依次连接各点,得到一条下凸的罗伦次曲线。

例如,根据表2.5.4中的数据,我们就可以按照上述步骤

作出某地区收入分配的罗伦次曲线(图2.5.3)。

表2.5.4某地区各亚区的收入分配情况

亚区代码

人口占全区的比重(p)

收入占全区的比重(w)

w/p

p的累计(X)

w的累计(Y)

24

0.0279

0.0102

0.3660

0.0279

0.0102

28

0.0203

0.0101

0.4984

0.0482

0.0203

26

0.0021

0.0012

0.5822

0.0503

0.0215

25

0.0340

0.0201

0.5921

0.0843

0.0417

20

0.0356

0.0211

0.5930

0.1198

0.0627

27

0.0286

0.0171

0.5983

0.1484

0.0798

30

0.0045

0.0027

0.6136

0.1528

0.0826

23

0.0660

0.0413

0.6252

0.2188

0.1238

14

0.0328

0.0206

0.6283

0.2516

0.1444

4

0.0261

0.0169

0.6474

0.2777

0.1613

12

0.0474

0.0313

0.6591

0.3252

0.1926

29

0.0041

0.0027

0.6608

0.3293

0.1953

22

0.0245

0.0163

0.6679

0.3537

0.2117

16

0.0733

0.0529

0.7208

0.4271

0.2645

18

0.0510

0.0380

0.7444

0.4781

0.3025

5

0.0188

0.0144

0.7657

0.4969

0.3169

21

0.0062

0.0053

0.8555

0.5032

0.3222

7

0.0216

0.0187

0.8669

0.5248

0.3410

31

0.0153

0.0140

0.9203

0.5400

0.3550

17

0.0478

0.0440

0.9212

0.5878

0.3990

3

0.0534

0.0524

0.9798

0.6412

0.4513

8

0.0292

0.0335

1.1450

0.6704

0.4848

15

0.0719

0.0879

1.2218

0.7423

0.5727

6

0.0336

0.0480

1.4306

0.7759

0.6207

19

0.0685

0.0994

1.4518

0.8444

0.7201

13

0.0275

0.0403

1.4665

0.8719

0.7604

10

0.0589

0.0883

1.4984

0.9308

0.8487

11

0.0371

0.0621

1.6759

0.9679

0.9108

2

0.0079

0.0169

2.1266

0.9758

0.9277

1

0.0109

0.0255

2.3290

0.9867

0.9532

9

0.0133

0.0468

3.5303

1.0000

1.0000

图2.5.3某地区收入分配的罗伦次曲线

假若上述罗伦次曲线的解析表达式为:

(2.5.4)

则该曲线下方区域的面积为:

(2.5.5)

显然,对应于绝对均衡分布,其罗伦次曲线就是正方形的对角线,其下方区域的面积为R=1/2。

这样,模仿公式(2.5.3),基尼系数(G)就可以按照如下公式计算:

(2.5.6)

在实际应用中,由于同样存在求罗伦次曲线解析式的困难,所以人们常常采用各种近似方法计算基尼系数,例如,曲线拟合法就是其中一种方法。

如果用幂函数

拟合

,则基尼系数的近似计算公式为:

(2.5.7)

式中:

可以通过最小二乘法(详见第3章)拟合,即:

根据分组数据,基尼系数也可以按照如下方法近似地计算:

按人均收入由低到高进行排序,分成若干组(如果不分组,则每一户或每一人为一组),每组收入占总收入比重为

,每一组人口比重为

,则基尼系数可以按照下式近似地计算:

(2.5.8)

式中:

为从第1组到第

组的累积收入比重。

将表2.5.4中的有关数据代入公式(2.5.8),可以计算出该地区的基尼系数为G=0.2467。

联合国有关组织规定:

G小于0.2,表示收入分配高度均衡;G介于0.2~0.3之间,表示收入分配比较均衡;G介于0.3~0.4之间,表示收入分配相对合理;G介于0.4~0.5之间,表示收入分配差距较大;0.6以上表示收入分配差距悬殊。

从这些判断标准的来看,上述地区的收入分配还是比较均衡的。

根据中国大陆1978-2002年各省(直辖市、自治区)的人口数和按照可比价格折算的GDP数据,计算基尼系数,结果如图2.5.4。

可以看出,在1978-1990年期间,基尼系数虽然出现过几次上升和下降的微小波动,但基本趋势是缓慢地下降的;而在1991-2002年期间,基本上呈现上升趋势。

这一结论,与上节计算的加权变异系数是相互印证的。

需要说明的是,为了进一步揭示收入差异的区域或产业构成,还可以对于基尼系数进一步按照区域或产业部门进行分解计算。

由于篇幅所限,我们在此不拟再做过多的介绍,有兴趣的读者可以进一步阅读其它有关文献。

图2.5.41978—2002年中国大陆省际收入差异的基尼系数

三、锡尔系数

除了基尼系数以外,也可以用锡尔(Theil)系数对于经济发展、收入分配等均衡(不均衡)状况,进行定量化的描述。

锡尔系数又称锡尔熵,最早是由TheilandHenri于1967年首先提出的。

Theil系数的算法有两种,由此产生两个锡尔系数指标,即锡尔系数T和锡尔系数L,两者的不同之处在于锡尔系数T以收入比重加权计算,而锡尔系数L则以人口比重加权计算。

如果以人口比重加权,锡尔系数L的计算公式为:

(2.5.9)

式中:

n为区域(部门)个数;

地区(部门)收入占全区(各部门总计)的份额;

地区(部门)的人口占全区(各部门总计)的份额。

锡尔系数越大,就表示收入分配差异越大;反之,锡尔系数越小,就表示收入分配越均衡。

如果以收入比重加权,则锡尔系数T的计算公式为:

(2.5.10)

根据各省(直辖市、自治区)的人口和按照可比价格折算的GDP数据,运用(2.5.10)式计算1978—2002年中国大陆省际差异的锡尔系数T值,结果图2.5.5所示。

可以看出,在1978—1990年期间,锡尔系数虽然有微小波动,但基本上呈下降趋势;而在1991—2002年期间,基本上呈显出上升趋势。

这一结论,与前面计算出的基尼系数也是相互印证的。

图2.5.51978-2002年中国大陆省际收入差异的锡尔系数

需要说明的是,为了进一步揭示收入差异的区域或产业构成,还可以对于锡尔系数进一步按照区域或产业部门进行分解计算。

由于篇幅所限,我们在此不拟再做过多的介绍,有兴趣的读者可以进一步阅读其它有关文献。

参考文献

陈述彭.地球科学的复杂性与系统性.地理科学,1991,11(4):

297~305.

林炳耀.计量地理学概论.北京:

高等教育出版社,1985.

张超,杨秉庚.计量地理学基础.北京:

高等教育出版社,1984.

张超,陈丙咸,邬伦.地理信息系统.北京:

高等教育出版社,1995.

徐建华,方创琳,白新萍.遥感分析方法与GIS技术.兰州:

甘肃科学技术出版社,1995.

徐建华,白新萍等.三西地区扶贫开发决策支持系统研究.中国沙漠,1999,19

(1):

86~90.

徐建华.地理系统分析.兰州:

兰州大学出版社.1991.

徐建华.现代地理学中的数学方法(第1版).北京:

高等教育出版社,1996年.

徐建华.现代地理学中的数学方法(第2版).北京:

高等教育出版社,2002年.

徐建华,鲁凤,苏方林,卢艳.中国区域经济差异的时空尺度分析.地理研究,2005,24

(1):

57~68.

徐建华,岳文泽,谈文琦.城市景观格局尺度效应的空间统计规律.地理学报,2004,59(6):

1058~1067.

徐建华、艾南山、金炯、樊胜岳.西北干旱区景观要素镶嵌结构的分形研究.干旱区研究,2001(3):

35~39.

岳文泽,徐建华,谈文琦等.城市景观多样性的空间尺度分析.2005,生态学报,25

(1):

130~137.

吴玉鸣,徐建华.中国区域经济增长集聚的空间统计分析.地理科学,2004,24(6):

654~659.

艾彬,徐建华,岳文泽.湖南省城市空间关联研究.地域研究与开发,2004,23(6):

48~52.

杨吾扬.区位论原理——产业、城市和区域的区位经济分析.兰州:

甘肃人民出版社,1989.

李军,周成虎.地学数据特征分析.地理科学,1999,19

(2):

158~162.

湖南城调队.基尼系数及其实际应用.见:

中央政研室、农业部农村固定观察点办公室(关锐捷、张晓辉、郭建军执笔).“九五”期间中国农民收入状况实证分析.农业经济问题,2001年,第1期。

NigelWalford.GeographicalDataAnalysis.Wiley&SonsLtd,1995.

S.Openshaw.ComputationalHumanGeography:

towardsaResearchAgenda.EnvironmentandPlanning,1994,(26):

499~505.

A.S.Fotheringham.TrendsinQuantitativeMethod

:

StressingtheComputational.ProgressinHumanGeography,1998,(22):

283~292.

 

思考题与练习题

1.地理数据有哪几种类型,各种类型地理数据之间的区别和联系是什么?

2.各种类型的地理数据的测度方法分别是什么?

3.地理数据的基本特征有哪些?

4.地理数据采集的来源渠道有哪些?

5.数学方法和地理信息系统在地理数据处理中各自发挥什么样的作用?

6.对表2.4.1中的分组数据,分别计算其平均值、中位数和众数。

7.查阅1980~2005年的中国经济统计年鉴,以各省(直辖市、自治区)的GDP数据为变量,运用平均值、方差、变异系数等统计量,对全国各年经济发展的一般水平、差异情况进行计算和分析。

8.某一地区各个亚区的GDP数据如下表所示。

试作出其各年份的罗伦次曲线、计算集中化指数,并由此比较不同年份该地区GDP在亚区之间分布的集中化程度。

习题2.8某地区各个亚区的GDP数据(单位:

亿元)

亚区代码

年份

1999

2000

2001

2002

2003

2004

1

1645.53

3769.69

3755.61

3469.81

3445.99

2962.48

2

79.66

151.55

174.88

153.98

137.41

141.92

3

390.24

628.94

673.39

735.93

634.23

641.52

4

74.12

210.81

223.87

193.17

173.03

162.78

5

167.38

517.09

411.58

462.88

393.17

480.73

6

44.55

187.06

201.89

189.50

189.69

154.75

7

150.88

402.74

465.04

499.11

446.98

469.67

8

211.62

657.16

733.89

921.47

938.48

1036.94

9

136.70

256.60

271.15

329.78

354.43

343.18

合计

2900.68

6676.30

911.29

6955.99

6713.16

6394.28

9.如果我们在作罗伦次曲线时,不是把某要素各组分的数据由大到小排序,而是由小到大排序,其结果又会怎么样呢?

如果这样操作,集中化指数的计算公式又应该是什么样的?

根据表2.5.3中的数据,试把各亚区的GDP数据由小到大排序,作出各年份的罗伦次曲线、计算集中化指数,并将计算结果与第8题的计算结果进行比较。

10.某一地区各个亚区的人口与GDP数据如下表所示。

试将纵、横坐标均以累计百分比表示,作出罗伦次曲线,并近似的计算基尼系数。

习题2.10某一地区各个亚区的人口与GDP数据

亚区代码

人口数(万人)

GDP(亿元)

1

3075

1479.71

2

8550

3711.61

3

3710

911.86

4

4192

1855.74

5

256

105.61

6

3618

1487.61

7

2543

931.98

8

510

238.39

9

543

241.49

10

1774

1168.55

全区合计

28771

12132.55

11.根据第10题中的数据,计算锡尔系数L指标和T指标。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 党团工作 > 党团建设

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1