多元统计分析报告.docx

上传人:b****7 文档编号:10144032 上传时间:2023-02-08 格式:DOCX 页数:26 大小:431.12KB
下载 相关 举报
多元统计分析报告.docx_第1页
第1页 / 共26页
多元统计分析报告.docx_第2页
第2页 / 共26页
多元统计分析报告.docx_第3页
第3页 / 共26页
多元统计分析报告.docx_第4页
第4页 / 共26页
多元统计分析报告.docx_第5页
第5页 / 共26页
点击查看更多>>
下载资源
资源描述

多元统计分析报告.docx

《多元统计分析报告.docx》由会员分享,可在线阅读,更多相关《多元统计分析报告.docx(26页珍藏版)》请在冰豆网上搜索。

多元统计分析报告.docx

多元统计分析报告

多元统计分析课程设计

 

主成分分析法在我国居民生活质量状况综合评价中的应用

 

姓名:

专业班级:

学院:

数学与系统科学学院

学号:

指导教师:

山东科技大学

2014年6月24日

 

摘要

改革开放以来,我国各地区间的经济发展速度有着明显差别,而人民的生活质量也因此产生了不同,本文用主成分分析法、聚类分析法,选取职工人均工资

,人均居住面积

,城市人口用水普及量

,城市煤气普及量

,人均拥有道路面积

,人均绿地公共面积

,批发零售贸易商品销售总额

,旅游外汇收入

8个指标,以综合因子的贡献率确定主成分和权重,计算出主成分分值值以及综合分值,对全国31个省市居民的生活质量进行了简单的分析,得到以下结论:

根据31个省市的综合分值可以将居民生活质量状况按照降序进行以下排序:

上海、广东、北京、江苏、浙江、福建、天津、山东、重庆、辽宁、湖北、安徽、湖

南、江西、山西、河北、陕西、四川、新疆、广西、青海、河南、云南、贵州、内蒙古、

宁夏、黑龙江、吉林、海南、甘肃、西藏。

 

关键词

主成分分析法、聚类分析法、居民生活质量状况、综合评价

使用软件:

SPSS17.0Matlab7.0

1.问题及背景

1.1背景提出

随着生产水平的的不断提高,我国居民生活水平不断提高,生活质量也在不断改进。

但是,受各地区生产力发展水平不平衡的影响,我国各地区居民生活质量也表现为不平衡。

1.2问题阐述

基于以上背景,我们决定利用主成分分析法对我国31个省市、自治区的居民生活质量状况进行评价分析。

为全面分析各地区居民生活质量的状况,特选取如下的指标体系进行反映:

职工人均工资

,人均居住面积

,城市人口用水普及量

,城市煤气普及量

,人均拥有道路面积

,人均绿地公共面积

,批发零售贸易商品销售总额

,旅游外汇收入

(符号下同)。

通过对以上指标进行分析,从而对我国的居民生活质量状况进行评价分析。

2主成分分析概念与方法

2.1主成分分析概念

主成分分析是由卡尔和皮尔逊最早在1901年提出,只不过当时是应用于非随机变量,1933年霍蒂林将这个概念推广到随机向量。

该方法是利用降维的思想,把多指标转化为几个综合指标的多元统计分析方法。

主成分分析的基本原理:

主成分分析是一种数学变换的方法,它把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量按照方差依次递减的顺序排列,在数学变换中保持变量的总方差不变,使第一变量具有最大的方差,称为第一主成分;第二变量的方差次大,并且和第一变量不相关,称为第二主成分;依次类推,

个变量就有

个主成分。

通过主成分分析方法,可以根据专业知识和指标所反映的独特含义对提取的主成分因子给予新的命名,从而得到合理的解释性变量。

将得到的主成分筛选、计算,最终得到综合评价结果。

2.2主成分分析法综合评价模型的基本步骤

基于主成分分析法的综合评价是根据评价等级中各因子的参数,通过主成分分析法的计算,得出基于主成分分析法的评价标准,再将待评价的事物按照主成分分析法,得出主成分值及综合分值,对照评价标准,得出综合评价结果。

2.3主成分分析法综合评价模型的具体步骤如下:

(1)建立观测样本矩阵:

式中:

(2)将原始数据标准化:

为了排除数量级和量纲不同带来的影响,采用以下公式对原始数据进行标准化处理。

其中,

(3)建立变量的相关系数矩阵:

式中,

是指标

与指标

之间的相关系数。

(4)计算特征方程:

计算特征方程

求解

的特征根

及其相应的单位特征向量。

其中,特征根为主成分

的方差,方差越大,则对总方差的贡献越大。

(5)计算各个成分的方差贡献率:

计算各个成分的方差贡献率

贡献率解释了主成分

所反映信息的大小,贡献率最大的主成分为第一主成分,其次为第二主成分,以此类推。

选择主成分的个数取决于主成分的累计方差贡献率

当前面

个主成分的累计贡献率大于

以上,基本上保留了原来因子

的信息,由此因子数将由

个减少为

个,从而起到筛选因子的作用。

写出主成分,即

(6)计算综合得分:

将待评价事物的标准化数据代入各主成分的表达式中,计算得到待评价事物的各主成分值

,以各主成分的方差贡献率

为权重求和,即得到待评价事物的综合分值为:

(7)评价等级及标准:

根据主成分分析法的评价标准,结合待评价事物的综合分值,最终得到待评价事物所属等级。

3主成分分析法在我国居民生活质量状况综合评价中的应用

3.1原始数据:

 

表一31个地区八项指标的具体数据

地区

X1

X2

X3

X4

X5

X6

X7

X8

北京

84742.00

38.70

100.00

100.00

7.57

11.87

2420.99

5149.00

天津

61514.00

28.31

100.00

100.00

17.88

10.54

731.30

2226.41

河北

38658.00

30.71

99.96

99.79

17.84

14.00

1100.51

544.94

山西

44236.00

26.52

97.64

95.18

11.79

10.82

379.53

720.24

内蒙古

46557.00

21.47

94.43

84.39

17.67

15.52

28.98

771.96

辽宁

41858.00

26.39

98.45

96.02

11.55

10.89

986.28

3263.69

吉林

38407.00

21.94

92.38

89.46

12.61

10.96

156.24

494.77

黑龙江

36406.00

21.72

94.14

83.39

11.83

11.75

227.59

835.48

上海

78673.00

60.48

100.00

100.00

4.08

7.08

3605.56

5493.23

江苏

50639.00

44.05

99.70

99.43

22.35

13.63

4851.52

6299.72

浙江

50197.00

60.48

99.88

99.49

17.88

12.47

2302.41

5151.74

安徽

44601.00

29.88

98.02

94.61

18.47

11.92

1501.48

1562.67

福建

44525.00

46.13

99.13

98.60

14.13

12.10

1196.42

4225.67

江西

38512.00

37.56

97.67

94.40

14.99

14.10

1010.74

484.73

山东

41904.00

32.98

99.85

99.48

24.70

16.37

2459.71

2923.65

河南

37338.00

31.69

91.76

77.94

11.08

9.23

806.17

611.41

湖北

39846.00

39.04

98.24

95.09

15.85

10.50

1555.38

1202.97

湖南

38971.00

40.72

96.42

91.33

13.49

8.83

909.92

928.36

广东

50278.00

27.89

97.62

94.93

13.42

15.82

4908.62

15610.67

广西

36386.00

31.75

95.30

93.26

14.74

11.42

841.05

1278.87

海南

39485.00

22.84

97.74

92.15

18.85

12.01

179.74

348.02

重庆

44498.00

35.03

93.84

93.32

10.67

18.13

975.47

1168.32

四川

42339.00

34.94

92.04

87.96

12.72

10.79

490.69

798.15

贵州

41156.00

25.27

92.07

71.35

6.80

9.38

17.23

168.94

云南

37629.00

27.44

94.32

66.46

11.92

10.43

472.03

1947.08

西藏

51705.00

23.97

75.39

29.79

14.22

9.40

1.98

105.70

陕西

43073.00

29.00

96.15

94.11

14.71

11.58

279.57

1597.47

甘肃

37679.00

19.87

92.77

77.81

12.56

9.52

203.04

22.35

青海

46483.00

19.78

99.90

92.65

11.17

9.81

24.72

24.32

宁夏

47436.00

23.06

92.30

79.67

17.56

15.71

123.33

5.45

新疆

44576.00

22.78

99.13

96.60

14.16

10.00

713.89

550.57

来源:

《中国统计年鉴2013》

3.2数据标准化

对表一中31个地区八项指标的具体数据进行标准化处理,把数据转换为标准指标正态分布,见表二:

表二31个地区八项指标的标准化数据

注:

正值表示该项指标位于平均值以上,零表示该项指标与平均值持平;负值表示位于平均值以下。

3.3相关系数矩阵

相关系数矩阵为:

3.4特征方程及主成分确定

通过计算,得到31个省市的标准化指标的相关系数矩阵特征值(表三)及其对应的特征向量(表四):

表三各特征值(从大到小)的贡献率

特征值

3.3475

1.7898

1.1705

0.6334

0.5136

0.3992

0.0858

0.0602

累计贡献率(%)

41.844

64.216

78.847

86.760

_______

_______

_______

_______

一般取特征值大于1,累积贡献率大于85%的因子作为主成分,由表三可以看出,前面4个主成分的贡献率达到86.760%,如果舍去后面的几个主成分,丢失的信息仅为13.240%。

可见,前面4个主成分基本上包含了全部指标具有的信息,因此本报告用前面4个主成分作新的指标代替原来的8项指标。

3.5各特征值的单位特征向量

表四各特征值的单位特征向量

3.6主成分值以及综合分值

3.6.1各个主成分的表达式

根据

可得下面四个主成分及综合分值:

其中:

指31个省市生活质量状况的第一主成分值;

指31个省市生活质量状况的第二主成分值;

指31个省市生活质量状况的第三主成分值;

指31个省市生活质量状况的第四主成分值;

表示居民生活质量综合水平。

3.6.2主成分命名解释

第一主成分在人均居住面积

,城市人口用水普及量

,城市煤气普及量

,批发零售贸易商品销售总额

上的系数绝对值比较大,说明第一主成分代表了我国居民生活质量状况中的居民基本生活保障设施。

第二主成分在职工人均工资

的系数的绝对值比较大,说明第二主成分代表了我国居民生活质量状况中人均收入。

第三主成分在人均拥有道路面积

,人均绿地公共面积

,旅游外汇收入

的系数的绝对值比较大,说明第三主成分代表了我国居民生活质量状况中城市建设以及风景区的规划。

3.7各主成分上的得分

表五31个省市居民生活质量状况在第一主成分(

)上的得分

北京天津河北山西内蒙古辽宁吉林黑龙江

8.97832.64431.3063-1.6436-3.11150.3493-5.0659-5.0020

上海江苏浙江安徽福建江西山东河南

11.461211.23429.07591.21964.49070.64255.4400-4.9073

湖北湖南广东广西海南重庆四川贵州

1.4644-0.701412.4728-1.4436-2.51960.5098-2.8946-7.2911

云南西藏陕西甘肃青海宁夏新疆

-5.2924-15.0004-1.3725-6.8743-2.8545-4.1202-1.1945

由表五可得,广东、上海、江苏、浙江、北京在第一主成分上的得分比较高,说明这些地区在居民基本生活保障设施以及消费上做得比较好;而西藏、云南等地区的得分比较低,说明他们在这一方面还需要加大力度,提高居民的基本生活保障设施以及消费水平。

表六31个省市居民生活质量状况在第二主成分(

)上的得分

北京天津河北山西内蒙古辽宁吉林黑龙江

4.4824-0.0625-2.95190.2421-2.59080.2257-0.1537-0.3312

上海江苏浙江安徽福建江西山东河南

7.7574-1.85840.0437-1.57230.0671-1.7066-4.99271.6287

湖北湖南广东广西海南重庆四川贵州

-0.38021.0044-0.2900-0.8051-2.4633-1.47460.80592.7372

云南西藏陕西甘肃青海宁夏新疆

0.99673.7708-0.60260.53150.5129-2.2719-0.2988

由表六可得,上海、北京在第二主成分上的份比较高,这也符合我国的基本情况,对于这种特大城市,居民的人均收入确实比较高;北京位于我国的首都,经济文化比较发达,人均收入也比较高;而上海是我国最大的城市,人均收入也比较高。

表七31个省市居民生活质量状况在第三主成分(

)上的得分

北京天津河北山西内蒙古辽宁吉林黑龙江

0.0188-0.9060-0.7439-1.18470.7127-0.7512-0.3571-0.1780

上海江苏浙江安徽福建江西山东河南

-0.75051.57150.0951-0.2494-0.4763-0.42360.8305-0.0264

湖北湖南广东广西海南重庆四川贵州

-0.8134-1.07843.6080-0.4546-0.68790.7789-0.1554-0.1977

云南西藏陕西甘肃青海宁夏新疆

0.51304.1175-0.5944-0.2350-1.72681.1101-1.3654

+由表七可得,西藏、江苏、广东、宁夏、山东在第三主成分上的得分比较高,说明这些地区的城市建设以及风景旅游收入比较高,而这些地区确实风景区比较多,每年去西藏旅游的人数也比较多,说明城市建设的比较好。

表八31个省市居民生活质量状况在第四主成分(

)上的得分

北京天津河北山西内蒙古辽宁吉林黑龙江

0.88780.1732-0.05100.33310.40600.46060.25690.3663

上海江苏浙江安徽福建江西山东河南

-0.2978-0.7128-1.1428-0.1913-0.3756-0.2344-0.3477-0.3287

湖北湖南广东广西海南重庆四川贵州

-0.5882-0.68681.1800-0.20570.01010.4994-0.29930.2780

云南西藏陕西甘肃青海宁夏新疆

-0.0452-0.71790.07880.12900.63120.24340.2913

注:

表八可以作为平衡项目,对前三个主成分进行补充与平衡的作用。

3.8综合因子得分

由因子得分函数计算出各主成分的综合得分(升序)

,其中

为特征值)如表九:

表九31个省市区主成分综合得分(升序)

西藏

甘肃

海南

吉林

黑龙江

宁夏

内蒙古

贵州

-7.8299

-6.4488

-5.6608

-5.3198

-5.1449

-5.0386

-4.5835

-4.4735

云南

河南

青海

广西

新疆

四川

陕西

河北

-3.8278

-3.6337

-3.4372

-2.9089

-2.5674

-2.5433

-2.4907

-2.4405

山西

江西

湖南

安徽

湖北

辽宁

重庆

山东

-2.2531

-1.7221

-1.4621

-0.7934

-0.3174

0.2843

0.3135

0.9301

天津

福建

浙江

江苏

北京

广东

上海

1.8490

3.7059

8.0718

10.2345

14.3672

16.9709

18.1703

3.9评价结果和排序

(1)根据31个省市的综合分值可以将居民生活质量状况按照降序进行以下排序:

上海、广东、北京、江苏、浙江、福建、天津、山东、重庆、辽宁、湖北、安徽、湖南、江西、山西、河北、陕西、四川、新疆、广西、青海、河南、云南、贵州、内蒙古、宁夏、黑龙江、吉林、海南、甘肃、西藏。

(2)根据以上得分我们将31个省市分为4类,分类标准为:

大于8的为优,大于0但是小于8的为良,大于-5但是小于0的为中,小于-5的为差。

上海、广东、北京、江苏、浙江居民的生活质量水平为优;

福建、天津、山东、重庆、辽宁居民的生活质量水平为良;

湖北、安徽、湖南、江西、山西、河北、陕西、四川、新疆、广西、青海、河南、云南、贵州、内蒙古居民的生活质量水平为中;

宁夏、黑龙江、吉林、海南、甘肃、西藏居民的生活质量水平为差;

从以上结果看出我国居民生活质量水平跟地域有着十分密切的关系,发达地区的生活质量明显高于欠发达地区的生活质量水平;沿海地区的生活质量水平明显大于内陆的生活质量水平;从总体上看主要呈现沿海→近沿海→中部→东北、华北→西北→西南”逐渐降低的趋势。

4.聚类分析

(1)由于人均居住面积、城市燃气普及量、批发零售贸易商品销售总额在第一主成分上得分比较高,因此对其进行聚类分析得(详见附录三):

如果将31个省份分成四类,则北京、上海分为第一类;天津为第二类;江苏、浙江、广东、西藏为第三类;其余为第四类;考虑到各省的实际情况,可以看出此分类基本上合理。

因此也验证了主成分分析法的合理性。

(2)由于人均道路、人均绿地面积在第二主成分上得分较高,进行聚类分析有(详见附录四):

如果将31个省份分成四类,北京、贵州为第一类;江苏、山东为第二类;重庆为第三类;剩下的为第四类。

(3)将职工人均工资、人均居住面积、城市燃气普及量、人均道路、人均绿地面积、批发零售贸易商品销售总额、旅游外汇收入进行聚类分析(详见附录五):

如果将31个省份分成五类,北京、上海为第一类;天津为第二类;广东为第三类;江苏、浙江、西藏为第四类;剩余的省市为第五类。

5建议

从上述分析不难看出,居民生活水平与质量的高低,很大程度上取决于地区的经济发展水平。

因此,要把居民的生活质量提升到更高水平,必须把加快经济发展,作为提高居民生活质量、全面建设小康社会的首要任务来抓。

针对上述问题,本人提出以下几点对策与建议:

1.加快各地区经济发展,提高居民收入水平

经济发展水平直接影响居民收入水平、生存环境和生活质量。

通过分析可以看出:

北京、上海、广东的居民生活质量排名前三位,在很大程度上依赖于其较高的居民人均收入和人均GDP,因此加快城市经济发展刻不容缓。

各地区要加快地方产业结构调整,优化消费结构,大力发展社区经济,搞好国有企业改革,扩大就业,增加居民收入;大力发展第三产业,刺激居民消费倾向,投资、消费、出口是推动经济发展的三驾马车,消费反作用于经济发展的力量不可忽视。

2.提升城市文化品质,提高居民生活质量

提高城市文化品质的整体水平,拓展消费领域,优化消费结构,满足人们多样化的物质文化生活需求,提高生活质量。

应从以下三方面着手:

第一,发展各级各类教育,提高市民文化水平,增强市民文化素养,针对不同地域,政府在制定教育政策时,应该在尊重多样教育需求的基础上,对于弱势的一方更应给予较多关注,优先扶持,尽量缩小区域间城市居民的教育生活质量的差距;第二,加强社区文化与住区文化建设,将有益于市民的身心健康,使城市居民在轻松愉悦的环境中受益;第三,加强城市文化的硬件建设,如修建文化馆、博物馆和图书馆等,为居民提供多途径的精神文化享受。

3.加大城市基础设施建设,提高人民生活水平

城市基础设施是现代化城市赖以生存和发展的基本条件,是为城市国民经济各部门、人民生活提供服务的载体,它的好坏直接影响到城市经济发展和人民生活质量的提高。

在这方面北京、天津、上海做的较好,这在指标中就能体现,其它省市应向它们学习,可从以下几方面着手:

首先,在基础设施资金的筹集上,应拓展思路,通过各种渠道提供稳固而可靠的资金;其次,在城市公用事业和基础设施中引入竞争机制,采用灵活的经营方式;再次,努力提高城市基础设施建设的技术水平依靠技术进步提高服务设施的使用效率。

4.推进廉租房和经济适用房建设,改善居民的居住条件

从可持续发展的角度来说,节约用地、节约能源将成为提高居住区整体环境的主要因素。

东北三省在这一块步伐要迈的再大一点,具体包括:

加快旧城住宅区的改造,普遍提高城市居民的住宅质量;减少城市居住区环境污染,各地区城市都应努力提高居民住宅区生活垃圾无公害的处理率;改善住宅区的布局,要新颖别致、不拘一格,要符合生态和环境要求;加强城市绿化建设,增加城市的绿化道、绿化广场;深化房改,以市场引导房地产业,同时政府辅予必要的宏观调控,为住宅建设提供资金保障,平抑过高的房价,促进售房,切实为广大城市居民解决因房价过高而买不起房子的问题。

综上所述,我国各地区居民生活水平与质量存在一定的差异,而差异存在的决定性因素是各地区的经济发展不平衡,要减少我国居民生活水平与质量的差异就须从经济角度着手,缩小各省市经济发展水平的差距。

当然,经济发达不等于生活水平与质量好,任何一个省市要想成

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 工程科技 > 机械仪表

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1