多元统计分析大气污染的聚类Word下载.docx

资源描述

多元统计分析大气污染的聚类Word下载.docx

《多元统计分析大气污染的聚类Word下载.docx》由会员分享，可在线阅读，更多相关《多元统计分析大气污染的聚类Word下载.docx（11页珍藏版）》请在冰豆网上搜索。

多元统计分析大气污染的聚类Word下载.docx

0.003

0.102

0.048

0.015

0.106

0.21

0.263

0.086

0.072

0.274

0.196

0.211

0.187

0.082

0.301

0.053

0.06

0.209

0.02

0.008

0.112

0.035

0.17

0.205

0.068

1.284

0.088

0.058

0.215

0.101

0.052

0.181

0.005

0.122

聚类分析:

录入数据

方法一：

分层（系统）聚类

按Analyze（分析）→Classify（分类）→HierarchicalCluster（系统聚类）顺序，单击菜单项，展开HierarchicalClusterAnalysis（系统聚类）分析对话框。

选择s,n,piaochen这3个变量为分析变量，移到Variables（变量）框中。

选择code作为标识变量，移到LabelCases（标注个案）框中。

在Cluster（分群）栏中选择系统默认的Cases（个案）项。

选中Statistics（统计量）复选项，单击Statistics（统计量）按钮，展开统计量选择对话框，进行下列选择：

选中Agglomenrationschedule,Proximitymatrix（合并进程表，相似性矩阵）。

在Clustermembership（聚类成员）栏中选择Singlesolution（单一方案）,并在其后的小矩形框中输入“3”。

然后继续。

在选中Plots（绘图）复选项，单击Plots（绘图）按钮，进行下列选择：

选中Dendrogram（树状图）.在Icicle（冰柱）栏中选择聚类的指定全距，并在下面的三个小矩形框中填入数字：

开始聚类:

1,停止聚类:

3,到:

1。

单击主对话框中的Method（方法）按钮，打开Method（方法）对话框

在ClusterMethod（聚类方法）参数框中选择Furthestneighbor（最远邻元素）.

在度量栏中选择区间,下拉列表中选择SquaredEuclideandistance项。

在TransformValue（转换度量）栏中选择标准化方法。

在Standardize（转换值）列表中选择range0to1项。

选择按照变量项。

在主对话框中按Save（保存）按钮，选择ClusterMembership（聚类成员）框中的Singlesolution（单一方案）项，在Numberofclusters聚类数）后的小矩形框中输入3.

在主对话框中按OK（确定）按钮，提交运行。

案例处理摘要a

案例

有效

缺失

合计

百分比

100.0%

.0%

a.平方Euclidean距离已使用

表一说明有16个值，没有缺失值。

聚类表

阶

群集组合

系数

首次出现阶群集

下一阶

群集1

群集2

.003

.007

.011

.012

.013

.014

.020

.052

.054

.070

.076

.184

.720

1.441

2.629

表二是聚类过程的输出。

由于选择了欧式距离平方作为距离测度，因此从表中可以看出数值较小的两项比数值大的两项先合并。

群集成员

4,5,11,12,16为第二类，13为第三类，其余为第一类。

3群集

1.00

2.00

3.00

4.00

5.00

6.00

7.00

8.00

9.00

10:

10.00

11:

11.00

12:

12.00

13:

13.00

14:

14.00

15:

15.00

16:

16.00

表三说明了聚类的具体情况。

由冰柱图，取值0到3之间，可以被一条直线结成三部分。

左边部分属于第二类，中间部分属于第三类，右边部分为第一类。

方法二：

快速聚类法

1.选择分析---K均值聚类。

2.将s，n，piaochen送入变量选框中。

将code移入个案标记依据。

方法中选择仅分类。

聚类数中填写3。

3.在保存中，选择聚类成员，单击继续。

4在选项中，选择ANOVA表，单击继续。

然后确定。

初始聚类中心

聚类

.066

.205

.039

.068

piaochen

.102

.264

最终聚类中心

.030

.113

.009

.061

.122

.238

ANOVA

误差

Sig.

均方

.018

6.616

.010

.005

.000

35.105

.574

.001

422.867

F检验应仅用于描述性目的，因为选中的聚类将被用来最大化不同聚类中的案例间的差别。

观测到的显著性水平并未据此进行更正，因此无法将其解释为是对聚类均值相等这一假设的检验。

每个聚类中的案例数

5.000

10.000

1.000

16.000

4,5,11,12,16为第一类，13为第三类，其余为第二类。

展开阅读全文