应用多元统计分析课程论文Word文件下载.docx

上传人:b****9 文档编号:13011320 上传时间:2022-10-02 格式:DOCX 页数:13 大小:148.38KB
下载 相关 举报
应用多元统计分析课程论文Word文件下载.docx_第1页
第1页 / 共13页
应用多元统计分析课程论文Word文件下载.docx_第2页
第2页 / 共13页
应用多元统计分析课程论文Word文件下载.docx_第3页
第3页 / 共13页
应用多元统计分析课程论文Word文件下载.docx_第4页
第4页 / 共13页
应用多元统计分析课程论文Word文件下载.docx_第5页
第5页 / 共13页
点击查看更多>>
下载资源
资源描述

应用多元统计分析课程论文Word文件下载.docx

《应用多元统计分析课程论文Word文件下载.docx》由会员分享,可在线阅读,更多相关《应用多元统计分析课程论文Word文件下载.docx(13页珍藏版)》请在冰豆网上搜索。

应用多元统计分析课程论文Word文件下载.docx

物流产业;

综合评价

一、引言

随着经济全球化持续发展、科学技术水平不断提高以及专业化分工进一步深化,经济的快速增长对物流业产生了巨大的需求,促使物流业以及与物流相关的交通运输、仓储配送和邮电通信业等都有较快的发展。

同时,作为经济增长的“加速器”物流业的快速发展将会改变国民经济增长方式,降低国民经济的运行成本,促进了经济的可持续发展。

物流对于经济增长的影响以及物流业与经济增长之间的关系已经成为物流领域的一个研究重点。

本文拟从主成分分析的角度出发,以江苏省数据为例来探讨哪些因素是物流发展的主要因素,对江苏省物流产业发展现状进行综合评价,从而为江苏省乃至全国的物流产业的发展提供一定的启示。

二、模型的建立

2.1主成分分析

主成分分析也称分量分析是把原来多个变量化为少数几个综合指标的一种统计分析方法,由于多个变量之间往往存在着一定程度的相关性,因此从数学角度来看,这是一种降维处理技术。

以各个主成分为分量就得到一个更低维的随机向量。

因此通过主成分分析既可以降低维数又保留了原数据的大部分信息。

假定有n个地理样本,每个样本共有p个变量描述,这样就构成了一个n×

p阶的数据矩阵

(1)

可是如此多的变量,我们如何从这么多变量的数据中抓住主要的变量作为指标呢?

要解决这一问题,自然要在p维空间中加以考察,这是比较麻烦的。

为了克服这一困难,就需要进行降维处理,即用较少的几个综合指标来代替原来较多的变量指标,而且使这些较少的综合指标既能尽量多地反映原来较多指标所反映的信息,同时它们之间又是彼此独立的。

那么,这些综合指标(即新变量)应如何选取呢?

显然,其最简单的形式就是取原来变量指标的线性组合,适当调整组合系数,使新的变量指标之间相互独立且代表性最好

如果记原来的变量指标为,,…,,它们的综合指标——新变量指标为,,…,(≤)。

(2)

(2)式中,系数由下列原则来决定:

(1)与(≠;

,=1,2,…,相互无关);

(2)量。

是,,…,的一切线性组合中方差最大者;

是与不相关的,,…,的所有线性组合中方差最大者;

……;

是与,,……都不相关的,,…,的所有线性组合中方差最大者。

这样决定的新变量指标,,…,分别称为原变量指标,,…,的第一,第二,…,第主成分。

其中,在总方差中占的比例最大,,,…,的方差依次递减。

在实际问题的分析中,常挑选前几个最大的主成分,这样既减少了变量的数目,又抓住了主要矛盾,简化了变量之间的关系。

从以上分析可以看出,找主成分就是确定原来变量(=1,2,…,)在诸主成分(=1,2,…,)上的载荷(=1,2,…,;

=1,2,…,),从数学上容易知道,它们分别是,,…,的相关矩阵的m个较大的特征值所对应的特征向量。

主成分分析是社会经济问题中研究应用最多的多元统计方法之一,其原理是利用降维的思想,在保证原始数据信息损失最小的前提下,将原来指标重新组合成一组新的互相无关的几个综合指标,这几个综合指标是原始指标的线性组合。

并且保留了原始指标的主要信息,彼此间又互不相关,使复杂的问题简单化,抓住主要矛盾进行分析。

基本步骤为:

确定分析变量,收集数据;

原始数据的标准化处理;

由标准数据求协方差矩阵;

求R的特征值、特征向量和主成分的方差贡献率;

提取主成分;

求主成分分值,计算综合分值。

2.1.1数据选取以及指标来源

根据上文主成分分析的基本原理,本文以江苏省为例,考虑到统计数据可获得性,本文选取“地区生产总值”作为物流需求规模影响指标;

选取“公路里程以及民用汽车拥有量”作为物流供给的影响因素;

选取“第一、第二、第三产业的产值”作为产业结构的影响因素。

具体选择的指标为:

地区生产总值,单位:

亿元;

第一产业产值,单位:

第二产业产值单位:

第三产业产值单位:

公路里程,单位:

公里;

以及车辆拥有量,单位:

万辆;

其中,三大产业不仅考虑了区域经济总量,还考虑了江苏省经济结构对物流需求规模影响。

(具体的原始数据见表1所示)

表12013年江苏省各地区6项主要指标

地 区

江苏省区

3825.76

98.72

1694.96

2032.08

7581

63.85

江阴市

1713.19

32.21

1028.40

652.58

2347

14.47

常州市区

1919.42

44.11

1098.67

776.64

3859

29.56

常熟市

1230.70

26.93

691.77

512.00

3042

13.51

张家港市

1402.00

19.98

870.32

511.70

1452

11.52

太仓市

612.01

24.66

355.35

232.00

1168

6.41

南通市区

1144.90

41.32

652.70

450.88

3051

15.91

启东市

359.50

49.29

188.48

121.73

2639

4.30

如皋市

355.15

36.97

198.28

119.90

2997

4.31

海门市

415.00

33.43

247.97

133.60

2256

4.03

扬州市区

830.87

19.77

483.79

327.31

1898

9.59

仪征市

227.29

13.05

137.27

76.97

1457

1.90

江都市

402.08

32.63

228.04

141.41

2116

3.64

镇江市区

741.26

16.51

442.62

282.13

1476

7.73

丹阳市

502.21

29.38

285.37

187.46

1991

4.55

扬中市

213.48

7.56

125.84

80.08

958

1.82

句容市

215.12

21.60

119.25

74.27

2307

1.56

泰州市区

458.53

11.79

291.89

154.85

1045

4.77

靖江市

364.43

15.41

214.69

134.33

1182

3.38

泰兴市

337.07

27.01

193.23

116.83

1967

3.26

数据来源:

江苏省统计年鉴2013

2.1.2先用因子分析对数据处理

我们要考虑的是:

如何根据这些经济指标,对各个地区进行综合评价与排序?

因子分析也是一种降维,简化数据的技术。

它通过研究众多变量之间的内部依赖关系,探求观察数据中的基本结构,在研究江苏省沿江地区物流发展示所涉及的指标很多,过多的指标容易导致分析过程复杂化。

一个合适的做法就是从这些关系错综复杂的经济指标中提取少数几个主要因子,每个主要因子都能反映相互依赖的社会经济指标见共同作用,因此选取“公路里程以及民用汽车拥有量”作为物流供给的影响因素;

选取“第一、第二、第三产业的产值”作为产业结构的影响因素,抓住这些主要因素就可以帮我们对复杂的物流发展问题进行深入分析,合理解释和正确评价。

2.1.3因子载荷的统计

对于因子模型:

我们可以得到与的协方差为

设因子载荷矩阵为,称第列元素的平方和,即

为公因子对的贡献,即表示同一公共因子对各变量所提供的方差贡献之总和,它是衡量每一个公共因子相对重要性的一个尺度。

三、模型求解

3.1以因子分析的结果进行主成分分析

(一)主要运算结果分析

变量共同反映每个变量对所提取的所有公共因子的依赖程度,此数值是因子载荷阵中每行的因子载荷的平方和,提取的因子个数不同,变量共同程度也不同。

从标准化数据出发,我们先计算这些指标的主成分,然后通过主成分的大小进行排序,对原始数据进行标准化处理。

计算特征值、方差贡献率以及各指标的相关系数矩阵。

利用SAS9.1.3软件对标准处理的数据进行处理。

特征值、方差贡献率的结果如表2所示,各指标的相关系数矩阵的特征值如表3所示,各地区的综合得分如表4所示,

表2方差分析表

主成分

初始特征值

提取的主成分载荷的平方和

特征值

方差贡献率%

累计方差贡献率%

1

5.4298

90.50

2

0.4658

7.76

98.26

3

0.0587

0.98

99.24

4

0.0361

0.60

99.84

5

0.0096

0.16

100.00

6

提取方法:

主成分法

提取主成分。

如表2所示,利用因子分析的结果进行主成分分析,提取前2个特征值的主成分,这两个主成分的累计方差贡献率达到98.26%,表明提取的前2个主成分可以基本反映全部6个指标所具有的信息,能在一定程度上说明区域物流产业发展的综合因素,从特征向量我们可以写出6个主成分的具体形式如下:

Prin1=0.x1+0.x2+0.x3+0.x4+0.x5+0.x6

Prin2=-0.x1+0.x

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 工程科技 > 材料科学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1