主成分分析论文.doc

上传人:b****3 文档编号:1977494 上传时间:2022-10-25 格式:DOC 页数:4 大小:120.50KB
下载 相关 举报
主成分分析论文.doc_第1页
第1页 / 共4页
主成分分析论文.doc_第2页
第2页 / 共4页
主成分分析论文.doc_第3页
第3页 / 共4页
主成分分析论文.doc_第4页
第4页 / 共4页
亲,该文档总共4页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

主成分分析论文.doc

《主成分分析论文.doc》由会员分享,可在线阅读,更多相关《主成分分析论文.doc(4页珍藏版)》请在冰豆网上搜索。

主成分分析论文.doc

利用主成分分析对江苏省沿江地区物流产业发展的综合评价

【摘要】现代物流的发展程度已经逐渐成为衡量一个区域或国家现代化程度和综合竞争力的重要标志之一。

物流产业的实质体现为技术密集和劳动密集相结合,是具有第三产业特征的跨地区、跨行业、跨部门特点的产业形式。

物流产业对经济增长,特别是区域经济增长和区域产业协作的推动,都有着不可替代的重大意义,在区域经济、产业布局研究过程中,都不能忽视物流产业在其中的基础保障作用。

本文在构建江苏省沿江地区物流产业发展综合指标体系的基础上,运用多元统计分析中的主成分分析方法,对江苏省沿江地区20个地市的物流发展现状进行了综合评价,为江苏省各地市物流产业主管部门制定相应政策提供一定的理论依据,旨在提高江苏省沿江地区整体物流发展水平。

【关键词】主成分分析物流产业综合评价

一.研究背景

经济的快速增长对物流业产生了巨大的需求,促使物流业以及与物流相关的交通运输、仓储配送和邮电通信业等都有较快的发展。

同时,作为经济增长的“加速器”物流业的快速发展将会改变国民经济增长方式,降低国民经济的运行成本,促进了经济的可持续发展。

物流对于经济增长的影响以及物流业与经济增长之间的关系已经成为物流领域的一个研究重点。

本文拟从主成分分析的角度出发,以江苏省数据为例来探讨哪些因素是物流发展的主要因素,对江苏省物流产业发展现状进行综合评价,从而为江苏省乃至全国的物流产业的发展提供一定的启示。

二.主成分分析方法介绍

主成分分析是把原来多个变量化为少数几个综合指标的一种统计分析方法,从数学角度来看,这是一种降维处理技术。

假定有n个地理样本,每个样本共有p个变量描述,这样就构成了一个n×p阶的数据矩阵:

如何从这么多变量的数据中抓住主要的变量指标呢?

要解决这一问题,自然要在p维空间中加以考察,这是比较麻烦的。

为了克服这一困难,就需要进行降维处理,即用较少的几个综合指标来代替原来较多的变量指标,而且使这些较少的综合指标既能尽量多地反映原来较多指标所反映的信息,同时它们之间又是彼此独立的。

那么,这些综合指标(即新变量)应如何选取呢?

显然,其最简单的形式就是取原来变量指标的线性组合,适当调整组合系数,使新的变量指标之间相互独立且代表性最好。

如果记原来的变量指标为x1,x2,…,xp,它们的综合指标——新变量指标为x1,x2,…,zm(m≤p)。

(2)式中,系数lij由下列原则来决定:

(1)zi与zj(i≠j;i,j=1,2,…,m)相互无关;

(2)z1是x1,x2,…,xp的一切线性组合中方差最大者;z2是与z1不相关的x1,x2,…,xp的所有线性组合中方差最大者;……;zm是与z1,z2,……zm-1都不相关的x1,x2,…,xp的所有线性组合中方差最大者。

这样决定的新变量指标z1,z2,…,zm分别称为原变量指标x1,x2,…,xp的第一,第二,…,第m主成分。

其中,z1在总方差中占的比例最大,z2,z3,…,zm的方差依次递减。

在实际问题的分析中,常挑选前几个最大的主成分,这样既减少了变量的数目,又抓住了主要矛盾,简化了变量之间的关系。

从以上分析可以看出,找主成分就是确定原来变量xj(j=1,2,…,p)在诸主成分zi(i=1,2,…,m)上的载荷lij(i=1,2,…,m;j=1,2,…,p),从数学上容易知道,它们分别是x1,x2,…,xp的相关矩阵的m个较大的特征值所对应的特征向量。

主成分分析是社会经济问题中研究应用最多的多元统计方法之一,其原理是利用降维的思想,在保证原始数据信息损失最小的前提下,将原来指标重新组合成一组新的互相无关的几个综合指标,这几个综合指标是原始指标的线性组合。

并且保留了原始指标的主要信息,彼此间又互不相关,使复杂的问题简单化,抓住主要矛盾进行分析。

基本步骤为:

确定分析变量,收集数据;原始数据的标准化处理;由标准数据求协方差矩阵;求R的特征值、特征向量和主成分的方差贡献率;提取主成分;求主成分分值,计算综合分值。

三.实证分析

(一)数据选取以及指标来源

根据上文主成分分析的基本原理,本文以江苏省为例,考虑到统计数据可获得性,本文选取“地区生产总值”作为物流需求规模影响指标;选取“公路里程以及民用汽车拥有量”作为物流供给的影响因素;选取“第一、第二、第三产业的产值”作为产业结构的影响因素。

具体选择的指标为:

地区生产总值x1、第一产业产值x2、第二产业产值x3、第三产业产值x4、公路里程x5以及车辆拥有量x6等。

其中,三大产业不仅考虑了区域经济总量,还考虑了江苏省经济结构对物流需求规模影响。

(具体的原始数据见表1所示)

表12009年江苏省沿江地区主要指标

地 区

地区生产总值(亿元)

第一产业(亿元)

第二产业(亿元)

第三产业(亿元)

公路里程(公里)

民用汽车拥有量(万辆)

江苏省区

3825.76

98.72

1694.96

2032.08

7581

63.85

江阴市

1713.19

32.21

1028.40

652.58

2347

14.47

常州市区

1919.42

44.11

1098.67

776.64

3859

29.56

常熟市

1230.70

26.93

691.77

512.00

3042

13.51

张家港市

1402.00

19.98

870.32

511.70

1452

11.52

太仓市

612.01

24.66

355.35

232.00

1168

6.41

南通市区

1144.90

41.32

652.70

450.88

3051

15.91

启东市

359.50

49.29

188.48

121.73

2639

4.30

如皋市

355.15

36.97

198.28

119.90

2997

4.31

海门市

415.00

33.43

247.97

133.60

2256

4.03

扬州市区

830.87

19.77

483.79

327.31

1898

9.59

仪征市

227.29

13.05

137.27

76.97

1457

1.90

江都市

402.08

32.63

228.04

141.41

2116

3.64

镇江市区

741.26

16.51

442.62

282.13

1476

7.73

丹阳市

502.21

29.38

285.37

187.46

1991

4.55

扬中市

213.48

7.56

125.84

80.08

958

1.82

句容市

215.12

21.60

119.25

74.27

2307

1.56

泰州市区

458.53

11.79

291.89

154.85

1045

4.77

靖江市

364.43

15.41

214.69

134.33

1182

3.38

泰兴市

337.07

27.01

193.23

116.83

1967

3.26

数据来源:

江苏省统计年鉴2010

(二)数据处理以及计算结果

对原始数据进行标准化处理。

计算特征值、方差贡献率以及各指标的相关系数矩阵。

笔者利用SAS9.1.3软件对标准处理的数据进行处理。

特征值、方差贡献率的结果如表2所示,各指标的相关系数矩阵的特征值如表3所示,各地区的综合得分如表4所示,

表2方差分析表

主成分

初始特征值

提取的主成分载荷的平方和

特征值

方差贡献率%

累计方差贡献率%

特征值

方差贡献率%

累计方差贡献率%

1

5.4298

90.50

90.50

5.4298

90.50

90.50

2

0.4658

7.76

98.26

0.4658

7.76

98.26

3

0.0587

0.98

99.24

4

0.0361

0.60

99.84

5

0.0096

0.16

100.00

6

0

0

100.00

提取方法:

主成分分析法

表3各指标相关系数矩阵的特征量

Prin1

Prin2

Prin3

Prin4

Prin5

Prin6

X1

0.419061

-.312072

0.104114

-.007028

-.219835

-.817180

X2

0.381547

0.631509

0.571777

-.355546

0.043954

0.018578

X3

0.399822

-.489653

0.491494

0.397004

0.216001

0.393125

X4

0.423129

-.176339

-.282026

-.368583

-.630198

0.421100

X5

0.400101

0.477188

-.358461

0.687302

-.106451

0.000000

X6

0.424067

-.072414

-.461121

-.328158

0.703280

0.000000

表4综合排序

综合排名

name

y

综合排名

name

y

1

南京市区

3.37845

11

江都市

-0.27657

2

常州市区

1.02504

12

丹阳市

-0.27753

3

江阴市

0.42134

13

镇江市区

-0.35718

4

南通市区

0.40129

14

太仓市

-0.38087

5

常熟市

0.25431

15

泰兴市

-0.39096

6

张家港市

-0.00599

16

句容市

-0.47082

7

启东市

-0.02973

17

靖江市

-0.61752

8

如皋市

-0.11500

18

泰州市区

-0.62347

9

扬州市区

-0.20189

19

仪征市

-0.67800

10

海门市

-0.23906

20

扬中市

-0.81584

四.结果分析

提取主成分。

如表2所示,提取前2个特征值的主成分,这两个主成分的累计方差贡献率达到98.26%,表明提取的前2个主成分可以基本反映全部6个指标所具有的信息,能在一定程度上说明区域物流产业发展的综合因素。

笔者利用SAS9.1.3统计软件进行数据的处理,得出相关系数矩阵的特征值(见表3),进而得到主成分的表达式可以表述为:

Prin1=0.419061x1+0.381547x2+0.399822x3+0.423129x4+0.400101x5+0.424067x6

Prin2=-0.312072x1+0.631509x2-0.489653x3-0.176339x4+0.477188x5-0.072414x6

 对原始数据进行标准化处理计算出各地区的综合得分(见表4),负分值不表示物流产业发展的能力差,评价分值只是反映了物流产业发展能力的相对强弱。

  从表4的综合排名可以看出,得分为正值的地区只有5个,得分为负值的市有15个,这信息说明江苏省的物流产业发展目前不容乐观,并且地区之间的发展不平衡,易形成两极分化的局势。

五.政策建议

针对本文影响物流产业发展能力的主要因素的分析,提高地区物流产业发展能力具体政策建议如下:

(一)加快产业结构的转换,构建合理的产业结构

从上述结果看第一产业产值与江苏省物流产业的发展呈现了高度的相关性,而并非第三产业,说明当第一、二、和第三产业构成比例不合理时,对物流需求就出现了削弱作用。

因此,在发展江苏省物流产业时必须先加

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 工程科技 > 电子电路

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1