主成分和聚类分析.docx

上传人:b****5 文档编号:27802565 上传时间:2023-07-05 格式:DOCX 页数:9 大小:469.87KB
下载 相关 举报
主成分和聚类分析.docx_第1页
第1页 / 共9页
主成分和聚类分析.docx_第2页
第2页 / 共9页
主成分和聚类分析.docx_第3页
第3页 / 共9页
主成分和聚类分析.docx_第4页
第4页 / 共9页
主成分和聚类分析.docx_第5页
第5页 / 共9页
点击查看更多>>
下载资源
资源描述

主成分和聚类分析.docx

《主成分和聚类分析.docx》由会员分享,可在线阅读,更多相关《主成分和聚类分析.docx(9页珍藏版)》请在冰豆网上搜索。

主成分和聚类分析.docx

主成分和聚类分析

4实证过程与结果

4.1主成分与聚类分析

首先通过SPSS软件对环境污染的相应指标进行主成分分析,得到:

提取Y1、Y2、Y3和Y4四个主成分,其累积贡献率已经达到,超过80%,代表所有环境污染指标的绝大部分信息。

Y1偏向于解释工业氢氧化物排放量,Y2偏向于解释生活烟尘排放量,Y3偏向于解释生活废水排放量,Y4偏向于解释工业二氧化硫排放量。

然后,根据主成分分析结果,用Z=0.43226*Y1+0.21911*Y2+0.10380*Y3+

0.06519*Y4计算综合得分,见下表1。

表1环境污染地区的主成分综合得分表

序号

地区

Z

排名

序号

地区

Z

排名

1

北京

0.863

5

17

武汉

-0.116

13

2

天津

1.088

4

18

长沙

-0.841

28

3

石家庄

0.455

6

19

广州

-0.373

19

4

太原

0.209

8

20

南宁

-0.519

24

5

呼和浩特

-0.052

12

21

海口

-1.29

31

6

沈阳

-0.273

17

22

重庆

2.767

1

7

长春

-0.257

16

23

成都

-0.451

20

8

哈尔滨

2.489

2

24

贵阳

-0.331

18

9

上海

1.979

3

25

昆明

-0.552

26

10

南京

-0.232

15

26

拉萨

-1.275

30

11

杭州

0.175

9

27

西安

0.357

7

12

合肥

-0.5

21

28

兰州

-0.514

23

13

福州

-0.525

25

29

西宁

0.004

11

14

南昌

-0.949

29

30

银川

-0.702

27

15

济南

0.022

10

31

乌鲁木齐

-0.502

22

16

郑州

-0.152

14

 

 

 

 

 

 

 

 

 

 

 

 

最后将环境污染的综合得分作为个案进行层次聚类分析,将31个地区分为5类,如表2。

表2各地区污染分类

分类

污染情况

地区

1

轻度污染

海口、拉萨

2

比较轻度污染

合肥、乌鲁木齐、福州、南宁、兰州、,昆明、成都、银川、南昌、长沙、沈阳、长春、南京、广州、贵阳、郑州、武汉、济南、西宁、呼和浩特

3

污染情况一般

太原、杭州、石家庄、西安

4

污染比较严重

北京、天津

5

污染十分严重

上海、哈尔滨、重庆

 

 

 

4.2主成分分析和聚类分析在SPSS中的操作过程

打开SPSS,“文件-打开-数据”,选中excel,如下图结果。

首先将变量标准化,“分析-描述统计-描述”,将变量全部选入对话框,点上“将标准化得分另存为变量(Z)”,结果如下。

在做主成分分析,“分析-降维-因子分析”,将为标准化的变量选入对话框。

选择右侧“描述”,在弹出来对话框中点上“系数、显著性水平、KMO和Bartlett的球形度检验”,点“继续”。

选择右侧“抽取”,在弹出来对话框中将方法改成“主成分”,“基于特征值”改成“0.6”,点“继续”。

选择右侧“旋转”,在弹出来对话框中,将方法改成“最大方差法”,点“继续”。

首先输出的各自变量的相关矩阵,由下图可见,各自变量间存在显著性相关。

说明有必要进行因子分析。

接着输出的是KMO和Bartlett的检验,结果如下图,由表可见,KMO是Kaiser-Meyer-Olkin的取样适当性度量,当KM0越大时,表示变量间的共同因素越多,越适合进行因子分析,此处KMO大于0.6,表示可进行因子分析。

此外,Bartlett球形检验的近似卡方分布为183.816(自由度为45)达到显著,代表有共同因素存在,适合进行因素分析。

同时,Bartlett球度检验给出的相伴概率为0.000,小于显著性水平0.05,故适合进行因子分析。

随后输出的解释的总方差,由下图可见,主成分个数为4时,累积贡献率已经达到82.037%,超过80%。

故本次因子分析中提取4个因子,我们分别称之为F1,F2,F3,F4。

在下面的成分矩阵图中可以看出,F1主要是和工业氢氧化物排放量有关,F2主要和生活烟尘排放量有关,F3主要和生活废水排放量有关,F4主要和工业二氧化硫排放量有关。

随后将成分矩阵表中的系数复制到数据窗口,并将变量名命名为a1,a2,

a3,a4。

再在数据窗口点击“转换-计算变量”,将目标变量t1=a1/SQRT(4.323)。

(括号内为对应主成分的初始特征值),依次算出t2,t3,t4。

则可知道Y1=0.382*Z工业废水排放量+0.365*Z工业化学需氧量排放量+0.262*Z工业二氧化硫排放量+0.397*Z工业烟尘排放量+0.404*工业氢氧化物排放量+0.120*Z生活废水排放量+0.357*Z生活化学需氧量排放量+0.320*Z生活二氧化硫排放量+0.136*Z生活烟尘排放量+0.261*Z生活氢氧化物排放量,依次依据t2,t3,t4得到Y2,Y3,Y4。

再依据Z=0.43226*Y1+0.21911*Y2+0.10380*Y3+0.06519*Y4得到综合得分,见表1。

然后做层次聚类分析,“分析-分类-系统-系统聚类”,在弹出来对话框把综合得分选入变量栏,在右侧“绘制”中点上“树状图”,点确定。

如下图。

依据下面的树状图,可将序号12,31,13,20,28,25,23,30,14,18,6,7,10,

19,24,16,17,15,29,5归结为一类,将21,26归结为一类,将4,11,3,27归结为一类,将1,2归结为一类,将8,22,9归结为一类。

再依据综合得分的大小,绘制表2。

 

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 人文社科 > 广告传媒

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1