多元统计分析大气污染的聚类.docx

上传人:b****4 文档编号:3735076 上传时间:2022-11-25 格式:DOCX 页数:11 大小:529.01KB
下载 相关 举报
多元统计分析大气污染的聚类.docx_第1页
第1页 / 共11页
多元统计分析大气污染的聚类.docx_第2页
第2页 / 共11页
多元统计分析大气污染的聚类.docx_第3页
第3页 / 共11页
多元统计分析大气污染的聚类.docx_第4页
第4页 / 共11页
多元统计分析大气污染的聚类.docx_第5页
第5页 / 共11页
点击查看更多>>
下载资源
资源描述

多元统计分析大气污染的聚类.docx

《多元统计分析大气污染的聚类.docx》由会员分享,可在线阅读,更多相关《多元统计分析大气污染的聚类.docx(11页珍藏版)》请在冰豆网上搜索。

多元统计分析大气污染的聚类.docx

多元统计分析大气污染的聚类

 

聚类分析

 

(大气污染的聚类)某城市的环保监测站在全市16个监测点抽取大气中二氧化硫、氮氧化物和飘尘的含量。

试用几种聚类方法进行聚类分析,并给出综合的分析结果。

序号

二氧化硫

氮氧化物

飘尘

1

0.045

0.043

0.265

2

0.066

0.039

0.264

3

0.094

0.061

0.194

4

0.003

0.003

0.102

5

0.048

0.015

0.106

6

0.21

0.066

0.263

7

0.086

0.072

0.274

8

0.196

0.072

0.211

9

0.187

0.082

0.301

10

0.053

0.06

0.209

11

0.02

0.008

0.112

12

0.035

0.015

0.17

13

0.205

0.068

1.284

14

0.088

0.058

0.215

15

0.101

0.052

0.181

16

0.045

0.005

0.122

聚类分析:

录入数据

方法一:

分层(系统)聚类

 

按Analyze(分析)→Classify(分类)→HierarchicalCluster(系统聚类)顺序,单击菜单项,展开HierarchicalClusterAnalysis(系统聚类)分析对话框。

选择s,n,piaochen这3个变量为分析变量,移到Variables(变量)框中。

选择code作为标识变量,移到LabelCases(标注个案)框中。

在Cluster(分群)栏中选择系统默认的Cases(个案)项。

选中Statistics(统计量)复选项,单击Statistics(统计量)按钮,展开统计量选择对话框,进行下列选择:

选中Agglomenrationschedule,Proximitymatrix(合并进程表,相似性矩阵)。

在Clustermembership(聚类成员)栏中选择Singlesolution(单一方案),并在其后的小矩形框中输入“3”。

然后继续。

在选中Plots(绘图)复选项,单击Plots(绘图)按钮,进行下列选择:

选中Dendrogram(树状图).在Icicle(冰柱)栏中选择聚类的指定全距,并在下面的三个小矩形框中填入数字:

开始聚类:

1,停止聚类:

3,到:

1。

单击主对话框中的Method(方法)按钮,打开Method(方法)对话框

在ClusterMethod(聚类方法)参数框中选择Furthestneighbor(最远邻元素).

在度量栏中选择区间,下拉列表中选择SquaredEuclideandistance项。

在TransformValue(转换度量)栏中选择标准化方法。

在Standardize(转换值)列表中选择range0to1项。

选择按照变量项。

在主对话框中按Save(保存)按钮,选择ClusterMembership(聚类成员)框中的Singlesolution(单一方案)项,在Numberofclusters聚类数)后的小矩形框中输入3.

在主对话框中按OK(确定)按钮,提交运行。

案例处理摘要a

案例

有效

缺失

合计

N

百分比

N

百分比

N

百分比

16

100.0%

0

.0%

16

100.0%

a.平方Euclidean距离已使用

表一说明有16个值,没有缺失值。

聚类表

群集组合

系数

首次出现阶群集

下一阶

群集1

群集2

群集1

群集2

1

3

14

.003

0

0

6

2

5

12

.007

0

0

7

3

4

11

.011

0

0

10

4

6

8

.012

0

0

9

5

1

2

.013

0

0

12

6

3

15

.014

1

0

11

7

5

16

.020

2

0

10

8

7

10

.052

0

0

11

9

6

9

.054

4

0

13

10

4

5

.070

3

7

15

11

3

7

.076

6

8

12

12

1

3

.184

5

11

13

13

1

6

.720

12

9

14

14

1

13

1.441

13

0

15

15

1

4

2.629

14

10

0

表二是聚类过程的输出。

由于选择了欧式距离平方作为距离测度,因此从表中可以看出数值较小的两项比数值大的两项先合并。

 

群集成员

案例

4,5,11,12,16为第二类,13为第三类,其余为第一类。

3群集

1:

1.00

1

2:

2.00

1

3:

3.00

1

4:

4.00

2

5:

5.00

2

6:

6.00

1

7:

7.00

1

8:

8.00

1

9:

9.00

1

10:

10.00

1

11:

11.00

2

12:

12.00

2

13:

13.00

3

14:

14.00

1

15:

15.00

1

16:

16.00

2

表三说明了聚类的具体情况。

由冰柱图,取值0到3之间,可以被一条直线结成三部分。

左边部分属于第二类,中间部分属于第三类,右边部分为第一类。

方法二:

快速聚类法

1.选择分析---K均值聚类。

 

2.将s,n,piaochen送入变量选框中。

将code移入个案标记依据。

方法中选择仅分类。

聚类数中填写3。

3.在保存中,选择聚类成员,单击继续。

4在选项中,选择ANOVA表,单击继续。

然后确定。

初始聚类中心

聚类

1

2

3

s

.003

.066

.205

n

.003

.039

.068

piaochen

.102

.264

1.284

最终聚类中心

聚类

1

2

3

s

.030

.113

.205

n

.009

.061

.068

piaochen

.122

.238

1.284

 

ANOVA

聚类

误差

F

Sig.

均方

df

均方

df

s

.018

2

.003

13

6.616

.010

n

.005

2

.000

13

35.105

.000

piaochen

.574

2

.001

13

422.867

.000

F检验应仅用于描述性目的,因为选中的聚类将被用来最大化不同聚类中的案例间的差别。

观测到的显著性水平并未据此进行更正,因此无法将其解释为是对聚类均值相等这一假设的检验。

 

每个聚类中的案例数

聚类

1

5.000

2

10.000

3

1.000

有效

16.000

缺失

.000

4,5,11,12,16为第一类,13为第三类,其余为第二类。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 求职职场 > 简历

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1