第5节地理数据分布的集中化与均衡度指数.docx-资源下载

第5节地理数据分布的集中化与均衡度指数.docx

1、第5节地理数据分布的集中化与均衡度指数第5节地理数据分布的集中化与均衡度指数地理现象的分布格局，常常用地理数据分布的集中化程度与均衡度来描述。为了揭示某种地理现象分布的基本格局，常常需要计算相关地理数据分布的集中化和均衡度指数。一、罗伦次曲线与集中化指数（1）罗伦次曲线20世纪初，意大利统计学家罗伦次（M. Lorenz），首先使用累计频率曲线研究工业化的集中化程度。后来，这种曲线就被称之为罗伦次曲线。下面我们通过实例，说明罗伦次曲线的做法和集中化指数的计算方法。表2.5.1 某地区农户家庭经营性纯收入水平及其构成部门代码产业部门20041999收入（元）占总收入的比重(%)收入（元）占总

2、收入的比重(%)1种植业2735.9342.821645.5356.732林业143.572.2579.662.753畜牧业660.6110.34390.2413.454渔业220.673.4574.122.565工业441.576.91167.385.776建筑业163.952.5744.551.547运输业516.878.09150.885.208商饮服务业1112.7217.42211.627.309其它393.166.15136.74.71合计家庭经营纯收入6389.051002900.68100表2.5.1描述了某地区农户家庭经营性纯收入水平及其构成情况。为了形象、直观地描述农户家庭

3、经营性纯收入在某些产业部门的集中化程度，可以按照以下步骤绘制罗伦次曲线：（1）将各产业部门的收入及其占总收入比重（百分比），从大到小重新排序；（2）从大到小，逐次计算累计百分比，得到表2.5.2和表2.5.3；（3）以自然序号为横坐标(x)，累计百分比为纵坐标(y)；以（部门代码，累计百分比）为坐标点，连成一个上凸的曲线（图2.5.1和图2.5.2），即罗伦次曲线。这里，要求作图时，将纵坐标轴和横坐标轴取成相等长度，使整个绘图区成正方形。罗伦次曲线的上凸程度，就表示农户家庭经营性纯收入的部门集中化程度。上凸程度越大，就表示农户家庭经营性纯收入越是集中于某些产业部门。如果各个产业部门的收入是均等

4、的，则罗伦次曲线正好就变成了正方形的对角线。比较图2.5.1和图2.5.2，从罗伦次曲线的上凸程度可以看出，该地区1999年农户家庭经营性纯收入的部门集中化程度高于2004年。罗伦次曲线，不但可以按部门，而且也可以按空间（地区），形象、直观地描述要素分布在地域空间上的集中化程度。如果按照部门构成，绘制出不同时期某要素数据分布的罗伦次曲线，就可以比较、分析不同时期该要素在部门之间分布的集中化程度；同样，对于一个特定的时期，如果按照空间（地区）构成，绘制出某要素数据分布的罗伦次曲线，就可以描述该时期该要素在地域空间上分布的集中化程度。表2.5.2 1999年农户家庭经营性纯收入大小排序的各部门比例

5、及累计百分比自然序号部门代码产业部门收入（元）占总收入的比重(%)累计百分比(%)11种植业 1645.5356.73 56.7323畜牧业 390.2413.45 70.18 38商饮服务业 211.627.30 77.48 45工业 167.385.77 83.25 57运输业 150.885.20 88.45 69其它136.74.71 93.16 72林业 79.662.75 95.91 84渔业 74.122.56 98.47 96建筑业 44.551.54 100.00 表2.5.3 2004年农户家庭经营性纯收入大小排序的各部门比例及累计百分比自然序号部门代码产业部门收入（元）占

6、总收入的比重(%)累计百分比（%）11种植业 2735.9342.82 42.8228商饮服务业 1112.7217.42 60.24 33畜牧业 660.6110.34 70.58 47运输业 516.878.09 78.67 55工业 441.576.91 85.58 69其它393.166.15 91.73 74渔业 220.673.45 95.18 86建筑业 163.952.57 97.75 92林业 143.572.25 100.00 图2.5.1 1999年农户家庭经营性纯收入构成的罗伦次曲线图2.5.2 2004年农户家庭经营性纯收入构成的罗伦次曲线（2）集中化指数集中化指数，

7、是一个描述地理数据分布的集中化程度的指数。假若罗伦次曲线的解析式为： (2.5.1)显然，该曲线下方区域的面积为： (2.5.2)当数据均匀分布时，A就变成了对角线以下三角形的面积（R）；当数据集中于一点时，A就变成了整个正方形的面积（M）。构造如下指数： (2.5.3)显然，I越大，就说明数据分布的集中化程度越高；反之，I越小，就说明数据分布的集中化程度越低（越均衡）。这个指数I，就被称为集中化指数。在实际应用中，由于难以得到罗伦次曲线函数的解析式，因而无法用公式(2.5.2)计算面积A。故，常常采用如下近似取值方法，即：A实际数据的累计百分比总和；R均匀分布时的累计百分比总和；M集中分布时

8、的累计百分比总和。由(2.5.3)式可以看出，当地理数据集中分布于一点时，AM，所以I1；当地理数据均匀分布时，AR，所以I0。也就是说，集中化指数在0，1区间上取值。可见，通过计算集中化指数，可以定量化的比较地理数据分布的集中化程度。但是，这里需要强调说明的是，只有数据的个数相同而且横坐标划分一致时，才有可比性。例如，根据表2.5.2中的数据，用 (2.5.3)式，可以计算某地区1999年农户家庭经营性纯收入构成的集中化指数：同样，根据以表2.5.3中的数据，用 (2.5.3) 式，也可以计算某地区2004年农户家庭经营性纯收入构成的集中化指数：从计算结果可以看出，与1999年相比，2004

9、年某地区农户家庭经营性纯收入构成的集中化指数降低了10.27。也就是说，与1999年相比，2004年某地区农户家庭经营性纯收入构成的集中化程度降低了，而均衡度增加了。这一结论正好印证了上述从罗伦次曲线的初步判断。二、基尼系数虽然我们可以使用罗伦次曲线和集中化指数描述一组数据分布的集中化程度，但是，对于经济发展、收入分配等均衡（不均衡）状况，往往需要通过对两组数据的对比分析，才能得到更为客观的结论。基尼系数（Gini coefficient），就是通过两组数据的对比分析，纵、横坐标均以累计百分比表示，从而做出罗伦次曲线，然后再计算得出的集中化指数。它是通过对人口和收入两组数据进行比较分析，然后将

10、纵、横坐标均以累计百分比表示，作出罗伦次曲线，再计算集中化指数而得到的一个判断收入分配不平等程度的指标。基尼系数，是意大利经济学家基尼(C.Gini)于20世纪初首先提出来的。其原理方法如下：列出每一个区域（部门）的人口与收入占全区（各部门总计）的比重p与w；计算每一区域（部门）的比率w/p；根据w/p值，由小到大将每一地区（部门）排序；按照上述顺序分别计算p和w的累计值X和Y；以X为横坐标，以Y为纵坐标，在直角坐标系中依次连接各点，得到一条下凸的罗伦次曲线。例如，根据表2.5.4中的数据，我们就可以按照上述步骤作出某地区收入分配的罗伦次曲线（图2.5.3）。表2.5.4 某地区各亚区的收入分

11、配情况亚区代码人口占全区的比重（p）收入占全区的比重（w）w/pp的累计（X）w的累计（Y）240.02790.01020.36600.02790.0102280.02030.01010.49840.04820.0203260.00210.00120.58220.05030.0215250.03400.02010.59210.08430.0417200.03560.02110.59300.11980.0627270.02860.01710.59830.14840.0798300.00450.00270.61360.15280.0826230.06600.04130.62520.21880.12

12、38140.03280.02060.62830.25160.144440.02610.01690.64740.27770.1613120.04740.03130.65910.32520.1926290.00410.00270.66080.32930.1953220.02450.01630.66790.35370.2117160.07330.05290.72080.42710.2645180.05100.03800.74440.47810.302550.01880.01440.76570.49690.3169210.00620.00530.85550.50320.322270.02160.018

13、70.86690.52480.3410310.01530.01400.92030.54000.3550170.04780.04400.92120.58780.399030.05340.05240.97980.64120.451380.02920.03351.14500.67040.4848150.07190.08791.22180.74230.572760.03360.04801.43060.77590.6207190.06850.09941.45180.84440.7201130.02750.04031.46650.87190.7604100.05890.08831.49840.93080.

14、8487110.03710.06211.67590.96790.910820.00790.01692.12660.97580.927710.01090.02552.32900.98670.953290.01330.04683.53031.00001.0000图2.5.3 某地区收入分配的罗伦次曲线假若上述罗伦次曲线的解析表达式为： (2.5.4)则该曲线下方区域的面积为： (2.5.5)显然，对应于绝对均衡分布，其罗伦次曲线就是正方形的对角线，其下方区域的面积为R=1/2。这样，模仿公式(2.5.3)，基尼系数（G）就可以按照如下公式计算： (2.5.6)在实际应用中，由于同样存在求罗伦次曲线

15、解析式的困难，所以人们常常采用各种近似方法计算基尼系数，例如，曲线拟合法就是其中一种方法。如果用幂函数拟合，则基尼系数的近似计算公式为： (2.5.7)式中：可以通过最小二乘法（详见第3章）拟合，即：根据分组数据，基尼系数也可以按照如下方法近似地计算：按人均收入由低到高进行排序，分成若干组（如果不分组，则每一户或每一人为一组），每组收入占总收入比重为，每一组人口比重为，则基尼系数可以按照下式近似地计算： (2.5.8)式中：为从第1组到第组的累积收入比重。将表2.5.4中的有关数据代入公式(2.5.8)，可以计算出该地区的基尼系数为G0.2467。联合国有关组织规定：G小于0.2，表示收入分配

16、高度均衡；G介于0.20.3之间，表示收入分配比较均衡；G介于0.30.4之间，表示收入分配相对合理；G介于0.40.5之间，表示收入分配差距较大；0.6以上表示收入分配差距悬殊。从这些判断标准的来看，上述地区的收入分配还是比较均衡的。根据中国大陆19782002年各省（直辖市、自治区）的人口数和按照可比价格折算的GDP数据，计算基尼系数，结果如图2.5.4。可以看出，在19781990年期间，基尼系数虽然出现过几次上升和下降的微小波动，但基本趋势是缓慢地下降的；而在19912002年期间，基本上呈现上升趋势。这一结论，与上节计算的加权变异系数是相互印证的。需要说明的是，为了进一步揭示收入差异

17、的区域或产业构成，还可以对于基尼系数进一步按照区域或产业部门进行分解计算。由于篇幅所限，我们在此不拟再做过多的介绍，有兴趣的读者可以进一步阅读其它有关文献。图2.5.4 19782002年中国大陆省际收入差异的基尼系数三、锡尔系数除了基尼系数以外，也可以用锡尔（Theil）系数对于经济发展、收入分配等均衡（不均衡）状况，进行定量化的描述。锡尔系数又称锡尔熵，最早是由Theil and Henri于1967年首先提出的。Theil系数的算法有两种，由此产生两个锡尔系数指标，即锡尔系数T和锡尔系数L，两者的不同之处在于锡尔系数T以收入比重加权计算，而锡尔系数L则以人口比重加权计算。如果以人口比重加

18、权，锡尔系数L的计算公式为： (2.5.9)式中：n为区域（部门）个数；为地区（部门）收入占全区（各部门总计）的份额；为地区（部门）的人口占全区（各部门总计）的份额。锡尔系数越大，就表示收入分配差异越大；反之，锡尔系数越小，就表示收入分配越均衡。如果以收入比重加权，则锡尔系数 T的计算公式为： (2.5.10)根据各省（直辖市、自治区）的人口和按照可比价格折算的GDP数据，运用(2.5.10)式计算19782002年中国大陆省际差异的锡尔系数T值，结果图2.5.5所示。可以看出，在19781990年期间，锡尔系数虽然有微小波动，但基本上呈下降趋势；而在19912002年期间，基本上呈显出上升趋

19、势。这一结论，与前面计算出的基尼系数也是相互印证的。图2.5.5 19782002年中国大陆省际收入差异的锡尔系数需要说明的是，为了进一步揭示收入差异的区域或产业构成，还可以对于锡尔系数进一步按照区域或产业部门进行分解计算。由于篇幅所限，我们在此不拟再做过多的介绍，有兴趣的读者可以进一步阅读其它有关文献。参考文献陈述彭. 地球科学的复杂性与系统性. 地理科学，1991，11（4）：297305.林炳耀. 计量地理学概论. 北京：高等教育出版社，1985.张超，杨秉庚. 计量地理学基础. 北京：高等教育出版社，1984.张超，陈丙咸，邬伦. 地理信息系统. 北京：高等教育出版社，1995.徐建华

20、，方创琳，白新萍. 遥感分析方法与GIS技术. 兰州：甘肃科学技术出版社，1995.徐建华，白新萍等. 三西地区扶贫开发决策支持系统研究. 中国沙漠，1999，19（1）：8690.徐建华. 地理系统分析. 兰州：兰州大学出版社.1991.徐建华. 现代地理学中的数学方法（第1版）. 北京：高等教育出版社，1996年. 徐建华. 现代地理学中的数学方法（第2版）. 北京：高等教育出版社，2002年. 徐建华, 鲁凤, 苏方林, 卢艳. 中国区域经济差异的时空尺度分析. 地理研究, 2005, 24(1)：5768.徐建华,岳文泽,谈文琦. 城市景观格局尺度效应的空间统计规律. 地理学报, 20

21、04, 59(6)：10581067.徐建华、艾南山、金炯、樊胜岳. 西北干旱区景观要素镶嵌结构的分形研究. 干旱区研究，2001(3):3539.岳文泽, 徐建华, 谈文琦等. 城市景观多样性的空间尺度分析. 2005, 生态学报，25(1):130137.吴玉鸣, 徐建华. 中国区域经济增长集聚的空间统计分析. 地理科学, 2004, 24(6)：654659.艾彬, 徐建华, 岳文泽. 湖南省城市空间关联研究. 地域研究与开发, 2004, 23(6)：4852.杨吾扬. 区位论原理产业、城市和区域的区位经济分析. 兰州：甘肃人民出版社，1989.李军，周成虎. 地学数据特征分析. 地理

22、科学，1999，19（2）：158162.湖南城调队. 基尼系数及其实际应用.见：中央政研室、农业部农村固定观察点办公室(关锐捷、张晓辉、郭建军执笔). “九五”期间中国农民收入状况实证分析. 农业经济问题，2001年，第1期。Nigel Walford. Geographical Data Analysis. Wiley & Sons Ltd, 1995.S. Openshaw. Computational Human Geography: towards a Research Agenda. Environment and Planning, 1994, (26):499505.A. S.

23、 Fotheringham. Trends in Quantitative Method: Stressing the Computational. Progress in Human Geography, 1998, (22): 283292. 思考题与练习题1. 地理数据有哪几种类型，各种类型地理数据之间的区别和联系是什么？2. 各种类型的地理数据的测度方法分别是什么？3. 地理数据的基本特征有哪些？4. 地理数据采集的来源渠道有哪些？5. 数学方法和地理信息系统在地理数据处理中各自发挥什么样的作用？6. 对表2.4.1中的分组数据，分别计算其平均值、中位数和众数。7.查阅19802005

24、年的中国经济统计年鉴，以各省（直辖市、自治区）的GDP数据为变量，运用平均值、方差、变异系数等统计量,对全国各年经济发展的一般水平、差异情况进行计算和分析。8.某一地区各个亚区的GDP数据如下表所示。试作出其各年份的罗伦次曲线、计算集中化指数，并由此比较不同年份该地区GDP在亚区之间分布的集中化程度。习题2.8 某地区各个亚区的GDP数据（单位：亿元）亚区代码年份19992000200120022003200411645.533769.693755.613469.813445.992962.48279.66151.55174.88153.98137.41141.923390.24628.946

25、73.39735.93634.23641.52474.12210.81223.87193.17173.03162.785167.38517.09411.58462.88393.17480.73644.55187.06201.89189.50189.69154.757150.88402.74465.04499.11446.98469.678211.62657.16733.89921.47938.481036.949136.70256.60271.15329.78354.43343.18合计2900.686676.30911.296955.996713.166394.289.如果我们在作罗伦次曲线

26、时，不是把某要素各组分的数据由大到小排序，而是由小到大排序，其结果又会怎么样呢？如果这样操作，集中化指数的计算公式又应该是什么样的？根据表2.5.3中的数据，试把各亚区的GDP数据由小到大排序，作出各年份的罗伦次曲线、计算集中化指数，并将计算结果与第8题的计算结果进行比较。10.某一地区各个亚区的人口与GDP数据如下表所示。试将纵、横坐标均以累计百分比表示，作出罗伦次曲线，并近似的计算基尼系数。习题2.10 某一地区各个亚区的人口与GDP数据亚区代码人口数（万人）GDP（亿元）130751479.71285503711.6133710911.86441921855.745256105.61636181487.6172543931.988510238.399543241.491017741168.55全区合计2877112132.5511.根据第10题中的数据，计算锡尔系数L指标和T指标。

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
特别说明：	请自助下载，系统不会自动发送文件的哦；如果您已付费，想二次下载，请登录后访问：我的下载记录
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？

第5节 地理数据分布的集中化与均衡度指数.docx