山东省各区域经济发展对比分析.docx
《山东省各区域经济发展对比分析.docx》由会员分享,可在线阅读,更多相关《山东省各区域经济发展对比分析.docx(23页珍藏版)》请在冰豆网上搜索。
山东省各区域经济发展对比分析
工业工程系《多元统计学》课程报告
山东省各区域经济发展对比分析
研究生姓名孙磊
指导教师姓名、职称朱波副教授
专业工业工程
起止日期2015年09月20日
报告提交日期2015年1月10日
山东省各区域经济发展对比分析
摘要
山东省是中国东部沿海的一个经济大省,改革开放以来,山东经济总量稳步扩大,人民生活水平显著提高,GDP在2013年的时候占据全国第三的高度,但其区域经济发展状况在很大程度上影响着山东省经济的发展。
本文选取山东省的17个地市中能够全面体现他们的经济综合实力的经济指标来进行分析。
这些地市的经济快速发展是带动山东省整体经济发展的重要动力,并不断引导着他们地区的经济和社会的持续发展。
本文选用山东省各市的经济指标和其他指标来考察山东省各市的经济的差异,采用多元统计学中的因子分析、聚类分析、判别分析综合评价地区经济发展水平,找出经济发展的差距及差距的主要原因,并提出协调发展的对策,促进区域经济协调发展加强区域合作,充分发挥各区域的区位优势谋求共同发展。
关键词:
山东经济,因子分析,聚类分析,判别分析
第一章.绪言
1.1研究背景及意义
近几年,在经历了几次全球性经济危机之后,中国的经济持续发展,分析经济综合实力具有重要意义,而在中国经济版图中,山东省的经济又占有不可忽视的地位。
山东省经济发展取得长足的进步,国民经济的发展稳定,人民生活水平不断提高。
但是由于经济基础、地理位置及国家政策等多方面的原因,山东省各地市的经济社会发展水平存在着较大的差异,因此各地市应该有自己的发展规划。
本文希望通过对主要经济指标的研究分析,希望能够达到以下的目的。
第一,客观评价山东省各地市的发展水平;第二,找出导致这种差异的主要原因;第三,提出协调发展的对策。
1.2指标选取与数据收集
1.2.1指标选取
区域经济是一定时间和空间范围内,对经济发展起决定作用的所有硬件和软件的总和。
由区域经济的概念可以看出,分析、比较经济发展实力不仅要分析经济发展水平的高低,还要考虑到影响经济发展的其他软件和硬件方面的因素。
其中,经济发展水平是决定区域经济发展实力的首要因素,因此论文在选取指标中选择了9个反映经济发展的指标,分别是社会消费品零售总额(亿元)、第三产业增加值(亿元)、居民消费水平(元)、各市境外投资(万美元)、各市外商直接投资(万美元)、农村居民人均全年生活消费总支出(元\人)、城镇居民人均可支配收入(元\人)、各市地方交通旅客运输量(万人)和各市生产总值(亿元)。
1.2.2数据收集
本文通过《山东统计年鉴2014》获取到山东2013年的上章所提的指标的原始数据。
具体各地市经济指标参见下表2-1。
表2-1各经济指标数据
各市标指
社会消费品零
售总额(亿元)
第三产业增
加值(亿元)
居民消费
水平(元)
各市外商直接投资(万美元)
各市境外投资(万美元)
农村居民人均全年生活消费总支出(元\人)
城镇居民人均可支配收入(元\人)
各市地方交通旅客运输量(万人)
各市生产
总值(亿元)
济南市
2743.35
2892.24
25057
132054
18783
7799
35648
12286
5230.19
青岛市
2986.81
4012.80
22790
552084
52795
9786
35227
23921
8006.60
淄博市
1568.17
1492.08
20554
52666
8718
8133
30889
42041
3801.24
枣庄市
645.08
643.27
13720
15850
186
6866
25238
7759
1830.63
东营市
593.72
874.59
20713
19335
2520
7813
33983
4486
3250.20
烟台市
2158.68
2117.76
18758
160597
31610
7343
32956
36084
5613.87
潍坊市
1830.39
1690.19
16707
81021
49044
8556
28386
23530
4420.70
济宁市
1534.11
1292.86
15082
83015
81121
6262
27956
10382
3501.54
泰安市
1066.39
1162.82
18162
30689
1044
6319
28201
6416
2790.70
威海市
1082.18
1033.29
28010
92018
7781
8493
31442
17439
2549.69
日照市
486.57
584.38
14898
52991
8231
5314
25090
4698
1500.16
莱芜市
257.75
237.95
15204
12134
563
6737
29179
4094
653.48
临沂市
1789.76
1428.64
9690
30870
12683
6204
30317
23739
3336.81
德州市
1007.42
885.38
13641
21472
940
5432
24812
12262
2460.59
聊城市
851.80
820.57
12304
16302
1502
5623
26087
9333
2365.87
滨州市
664.90
838.61
17242
30399
2494
7854
28363
6501
2155.73
菏泽市
1027.75
681.50
10827
21818
84
5163
21236
15935
2050.01
对上述指标进行描述统计,并作出条形图如下。
表2-2描述统计量
N
极小值
极大值
和
均值
标准差
方差
社会消费品零售总额(亿元)
17
257.75
2986.81
22294.83
1311.4606
784.74794
615829.334
第三产业增加值(亿元)
17
237.95
4012.80
22688.93
1334.6429
938.35135
880503.248
居民消费水平(元)
17
9690.00
28010.00
293359.00
17256.4118
4978.09405
24781420.382
各市外商直接投资(万美元)
17
12134.00
552084.00
1405315.00
82665.5882
128489.82511
16509635155.757
各市境外投资(万美元)
17
84.00
81121.00
280099.00
16476.4118
23575.04409
555782704.007
农村居民人均全年生活消费总支出(元\人)
17
5163.00
9786.00
119697.00
7041.0000
1325.57752
1757155.750
城镇居民人均可支配收入(元\人)
17
21236.00
35648.00
495010.00
29118.2353
3974.67511
15798042.191
各市地方交通旅客运输量(万人)
17
4094.00
42041.00
260906.00
15347.4118
11212.45613
125719172.382
各市生产总值(亿元)
17
653.48
8006.60
55518.01
3265.7653
1775.48196
3152336.206
有效的N(列表状态)
17
图2-1条形图
从图2-1中可以直观地看出,各指标的发展都最大值和最小值之间的差距显著,从表2-2描述统计量表还中可以看出,各指标的标准差都较大,也说明各指标的在山东省各地市的发展不均衡。
第二章.数据分析
2.1因子分析
2.1.1因子分析介绍
因子分析是主成分分析的推广,由1904年查尔斯·斯皮尔曼对学生考试成绩的研究的来,他利用降维思想由研究原始变量相关矩阵内部的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种变量统计方法,其出发点是原始变量的相关矩阵。
原始变量可以分解为两部分之和的形式,一部分是少数几个不可测的公因子的线性函数,另一部分是与公共因子无关的特殊因子。
在因子分析中得出的因子表达式之后,可以把原始变量的数据代入表达式得出因子得分值,根据因子得分在因子所构成的空间定位出样品点,达到分类的目的。
2.1.2因子分析的应用
将收集的资料导入数据分析软件SPSS19.0,通过计算得出以下图表数据。
表2.1-1描述统计量
N
均值
标准差
社会消费品零售总额(亿元)
17
1311.4606
784.74794
第三产业增加值(亿元)
17
1334.6429
938.35135
居民消费水平(元)
17
17256.4118
4978.09405
各市外商直接投资(万美元)
17
82665.5882
128489.82511
各市境外投资(万美元)
17
16476.4118
23575.04409
农村居民人均全年生活消费总支出(元\人)
17
7041.0000
1325.57752
城镇居民人均可支配收入(元\人)
17
29118.2353
3974.67511
各市地方交通旅客运输量(万人)
17
15347.4118
11212.45613
各市生产总值(亿元)
17
3265.7653
1775.48196
有效的N(列表状态)
17
根据表2.1-1描述统计量可以对衡量山东省各地市发展的各个指标进行大致的了解,获得各个指标在各区县的均值和标准差,以及各指标的样本个数。
相关矩阵
社会消费品零售总额(亿元)
第三产业增加值(亿元)
居民消费水平(元)
各市外商直接投资(万美元)
各市境外投资(万美元)
农村居民人均全年生活消费总支出(元\人)
城镇居民人均可支配收入(元\人)
各市地方交通旅客运输量(万人)
各市生产总值(亿元)
相关
社会消费品零售总额(亿元)
1.000
.950
.395
.737
.608
.525
.615
.611
.931
第三产业增加值(亿元)
.950
1.000
.504
.878
.562
.643
.697
.490
.966
居民消费水平(元)
.395
.504
1.000
.451
.147
.760
.744
.196
.472
各市外商直接投资(万美元)
.737
.878
.451
1.000
.546
.627
.550
.349
.843
各市境外投资(万美元)
.608
.562
.147
.546
1.000
.350
.301
.293
.620
农村居民人均全年生活消费总支出(元\人)
.525
.643
.760
.627
.350
1.000
.764
.401
.654
城镇居民人均可支配收入(元\人)
.615
.697
.744
.550
.301
.764
1.000
.329
.696
各市地方交通旅客运输量(万人)
.611
.490
.196
.349
.293
.401
.329
1.000
.582
各市生产总值(亿元)
.931
.966
.472
.843
.620
.654
.696
.582
1.000
从原始数据计算得到的相关矩阵可以看出,原始数据大部分变量的相关系数都大于0.3,因此所搜集的原始数据适合采用因子分析的方法。
KMO和Bartlett的检验
取样足够度的Kaiser-Meyer-Olkin度量。
.627
Bartlett的球形度检验
近似卡方
154.091
df
36
Sig.
.000
KMO和Bartlett的检验表明,KMO用于观测相关系数值和偏相关系数值的一个指标,KMO值越大,因子分析的相关性越强,越适合于作公共因子分析,并且因子分析的结果越好,表2.1-3显示KMO=0.627>0.5,说明原始数据适合做做因子分析;Bartlett’的球形检验P值为0.000<0.05,也说明原始数据适合做因子分子。
从上面的三个方面来看,都说明,影响山东省区域经济的各指标适合做因子分析,本节采用的方法是有效可行的。
2.1-4解释的总方差
成份
初始特征值
提取平方和载入
旋转平方和载入
合计
方差的%
累积%
合计
方差的%
累积%
合计
方差的%
累积%
1
5.777
64.184
64.184
5.777
64.184
64.184
4.033
44.813
44.813
2
1.297
14.413
78.598
1.297
14.413
78.598
3.041
33.785
78.598
3
.759
8.439
87.036
4
.475
5.276
92.312
5
.324
3.598
95.910
6
.208
2.314
98.225
7
.115
1.283
99.508
8
.041
.451
99.959
9
.004
.041
100.000
提取方法:
主成份分析。
从表2.1-4可以得知,选取的两个主成分F1、F2的方差占全部方差的比例为78.598%,选取的主成分能够解释选取的9个变量的绝大部分,基本上是对原来指标的信息保留,并且将原指标的9个维度降为了2维,利于分析。
旋转成份矩阵a
成份
1
2
社会消费品零售总额(亿元)
.891
.333
各市生产总值(亿元)
.867
.451
第三产业增加值(亿元)
.833
.486
各市境外投资(万美元)
.771
.018
各市外商直接投资(万美元)
.740
.442
各市地方交通旅客运输量(万人)
.631
.137
居民消费水平(元)
.080
.933
城镇居民人均可支配收入(元\人)
.353
.839
农村居民人均全年生活消费总支出(元\人)
.350
.837
提取方法:
主成份。
旋转法:
具有Kaiser标准化的正交旋转法。
a.旋转在3次迭代后收敛。
表2.1-5为旋转成分矩阵(RotatedComponentMatrix),也为载荷矩阵,是一个系数矩阵,原变量可由各因子表示,如:
X1=0.891×F1’+0.333×F2’,其矩阵模式为
X=AF’
其中:
X=
为标准化原始变量,A=
,F=
。
以各因子的方差贡献率占三个因子总方差贡献率的比重作为权重进行加权汇总,得出各城市的综合得分F’公式为:
F’=(44.813×F1’+33.785×F2’)/78.598
山东省各市因子得分和综合得分表如下
表2.1-6主因子得分和综合得分表
区域名称
F1'
F2'
F'
济南市
0.48918
1.41401
0.89942
青岛市
2.34580
1.31111
1.16357
淄博市
0.27132
0.53698
0.38551
枣庄市
-0.71286
-0.45272
-0.60104
东营市
-1.16583
1.25005
-0.12737
烟台市
1.24858
0.14827
0.77562
潍坊市
0.90152
0.14906
0.57808
济宁市
1.03808
-1.08198
0.12678
泰安市
-0.58503
0.06073
-0.30745
威海市
-0.97794
1.70171
0.17390
日照市
-0.65742
-0.78053
-0.71034
莱芜市
-1.30675
0.07190
-0.71245
临沂市
0.63054
-0.94682
-0.04748
德州市
-0.23276
-0.96056
-0.54560
聊城市
-0.34936
-0.88910
-0.58136
滨州市
-0.92479
0.41398
-0.34933
菏泽市
-0.01219
-1.64798
-0.71533
图2.1-1各城市因子得分图
通过图2.1-1以及对山东省各地市的了解,可以将山东省的区域经济划分为以下几类,如表2.1-7山东省各地市聚类(因子分析)所示。
表2.1-7山东省各地市聚类(因子分析)
地区类别
城市
第一类地区
青岛市
第二类地区
济南市、烟台市、潍坊市、济宁市、威海市
第三类地区
淄博市、枣庄市、东营市、泰安市、日照市、莱芜市、临沂市、德州市、聊城市、滨州市、菏泽市
从因素分析的结果来看,旋转后的因子载荷矩阵,公因子F1’在社会消费品零售总额、各市生产总值、第三产业增加值、各市境外投资、各市外商直接投资和各市地方交通旅客运输量上的载荷值很大,因此F1’是这六个全市经济指标的综合反映;公因子F2’在居民消费水平、城镇居民人均可支配收入、农村居民人均全年生活消费总支出上的载荷值远远高于其他指标,这说明F2’综合反映的是居民个人经济生活水平。
结合各个区县在公共因子和总得分情况,对山东省各市的发展情况进行评价。
在经济方面综合指标F1’得分最好的几个区县是青岛市、烟台市、济宁市;在居民个人经济生活水平方面综合指标F2’得分最好的是济南市,青岛市、东营市、威海市;总得分最高的地市是青岛市,这说明综合得分高的地市在选取的指标各方面发展比较均衡。
2.2聚类分析
2.2.1聚类分析介绍
近几年来,数理统计的多元分析方法有了迅速发展,多元分析的技术被引用如分类学中,于是聚类分析从数值分类学中逐渐分离出来,形成新的分支。
聚类分析是一种探索性的分析,在分类过程中,人们不必事先给出一个分类的标准,聚类分析能够从样本数据出发自动分类。
聚类分析的实质是建立一种分类方法,它能够将一批样本数据按照他们在性质上的亲密程度,在没有先验知识的情况下进行分类。
聚类的方法大致可以分为以下几种,层次聚类分析(或系统聚类分析)、模糊聚类分析、K-均值法、所有样品的聚类、分解法和加入法。
其中,层次聚类分析是应用最为广泛的分类方法。
2.2.2聚类分析的应用
本文选用系统聚类分析对重庆各区县进行聚类分析,其思想是将样品(或指标)各视为一类,根据类别之间的距离或相似程度将最近的类别合并,在计算新类别与其他类的相似程度,并选取最佳的加以合并,直到所有样品(或指标)合并为一类为止。
由于变量的量纲并不全部相同,因此要对变量进行标准化。
标准化的方法很多,本文选用Z得分法进行标准化变化,形式为
xij*=
(i=1,2,……,n;j=1,2,……,p)。
度量区间采用平方欧氏距离(SquaredEuclideanDistance),其计算公式为
EUCLID=
,
其中,k表示每个样本中有k个变量,Xi表示第一个样本在i个变量上的取值,Yi表示第二个样本在i变量上的取值。
聚类方法采用组间联接,它是两类之间的平方距离,公式为
DKL=
应用数据分析软件SPSS19.0,根据上述方法,为了照应因子分析得到的分组,选择分为3个类别,得出以下结论图标。
图2.2-1聚类树状图
根据软件分析,经整理得出的分组情况如表2.2-1。
表2.2-1山东省各地市聚类(聚类分析)
地区类别
地区
第一类地区
青岛市
第二类地区
济南市、烟台市、潍坊市、济宁市、威海市
淄博市、枣庄市、东营市、泰安市、日照市、莱芜市、临沂市、德州市、聊城市、滨州市、菏泽市
由山东省的区域经济发展常识来看,根据聚类分析所得的表2.2-1中的分类是正确的,这与本章上一节中的采用因子分析所得的分类大体趋势上是相同的,但是由于各种统计方面因素的影响,这样的分类也不尽如意。
将表2.2-1山东省各地市聚类(聚类分析)与表2.1-7山东省各地市聚类(因子分析)作对比,可以将山东省各地市划分为三类。
青岛市是山东省的沿海城市,经济一直位于山东的第一的位置,是山东的经济中心,因此可以青岛市作为第一类地区。
淄博市、潍坊市、济宁市是发展状况稍欠第一类地区,因此将其与沿海城市烟台市、威海市,以及山东省会济南市划分为一类,作为第二类地区。
将其与所有的城市划分为第三类地区。
如表2.2-2所示。
表2.2-2修正后的山东省各市聚类
地区类别
地区
第一类地区
青岛市
第二类地区
济南市、淄博市、烟台市、潍坊市、济宁市、威海市
第三类地区
枣庄市、东营市、泰安市、日照市、莱芜市、临沂市、德州市、聊城市、滨州市、菏泽市
2.3判别分析介绍
判别分析先根据已知类型的事物的性质(自变量),建立函数式(自变量的线性组合,即判别函数),然后对未知类别的新事物进行判断并将之归入已知的类别中。
判别分析不仅能够将未知类别的新事物归类处理,而且能够用以分析对聚类分析结果的准确性进行检验。
判别分析最基本的要求是分组类型在两组以上,每组案例的规模必须至少在一个以上,解释变量必须是可测量的。
2.3.2判别分析的应用
为了判断经过因子分析和聚类分析比较所得新的分类是否正确,本文采用判别分析的后一种功能对表2.2-2修正后的重庆区县分组进行判断检验。
软件处理的结果如下。
图2.3-1典则判别函数
表2.3-1分类结果a
组别
预测组成员
合计
1
2
3
初始
计数
1
5
0
0
5
2
0
1
0
1
3
0
0
11
11
%
1
100.0
.0
.0
100.0
2
.0
100.0
.0
100.0
3
.0
.0
100.0
100.0
a.已对初始分组案例中的100.0%个进行了正确分类。
表2.3-1得出对初始分组案例中的100.0%个进行了正确分类,因此表2.3-
2中的区县分类是正确的。
在图2.3-1中也能够体现,没有重叠的点。
第三章结论与对策
3.1结论
根据前两章的统计和