多元统计分析大气污染的聚类Word下载.docx
《多元统计分析大气污染的聚类Word下载.docx》由会员分享,可在线阅读,更多相关《多元统计分析大气污染的聚类Word下载.docx(11页珍藏版)》请在冰豆网上搜索。
4
0.003
0.102
5
0.048
0.015
0.106
6
0.21
0.263
7
0.086
0.072
0.274
8
0.196
0.211
9
0.187
0.082
0.301
10
0.053
0.06
0.209
11
0.02
0.008
0.112
12
0.035
0.17
13
0.205
0.068
1.284
14
0.088
0.058
0.215
15
0.101
0.052
0.181
16
0.005
0.122
聚类分析:
录入数据
方法一:
分层(系统)聚类
按Analyze(分析)→Classify(分类)→HierarchicalCluster(系统聚类)顺序,单击菜单项,展开HierarchicalClusterAnalysis(系统聚类)分析对话框。
选择s,n,piaochen这3个变量为分析变量,移到Variables(变量)框中。
选择code作为标识变量,移到LabelCases(标注个案)框中。
在Cluster(分群)栏中选择系统默认的Cases(个案)项。
选中Statistics(统计量)复选项,单击Statistics(统计量)按钮,展开统计量选择对话框,进行下列选择:
选中Agglomenrationschedule,Proximitymatrix(合并进程表,相似性矩阵)。
在Clustermembership(聚类成员)栏中选择Singlesolution(单一方案),并在其后的小矩形框中输入“3”。
然后继续。
在选中Plots(绘图)复选项,单击Plots(绘图)按钮,进行下列选择:
选中Dendrogram(树状图).在Icicle(冰柱)栏中选择聚类的指定全距,并在下面的三个小矩形框中填入数字:
开始聚类:
1,停止聚类:
3,到:
1。
单击主对话框中的Method(方法)按钮,打开Method(方法)对话框
在ClusterMethod(聚类方法)参数框中选择Furthestneighbor(最远邻元素).
在度量栏中选择区间,下拉列表中选择SquaredEuclideandistance项。
在TransformValue(转换度量)栏中选择标准化方法。
在Standardize(转换值)列表中选择range0to1项。
选择按照变量项。
在主对话框中按Save(保存)按钮,选择ClusterMembership(聚类成员)框中的Singlesolution(单一方案)项,在Numberofclusters聚类数)后的小矩形框中输入3.
在主对话框中按OK(确定)按钮,提交运行。
案例处理摘要a
案例
有效
缺失
合计
N
百分比
100.0%
.0%
a.平方Euclidean距离已使用
表一说明有16个值,没有缺失值。
聚类表
阶
群集组合
系数
首次出现阶群集
下一阶
群集1
群集2
.003
.007
.011
.012
.013
.014
.020
.052
.054
.070
.076
.184
.720
1.441
2.629
表二是聚类过程的输出。
由于选择了欧式距离平方作为距离测度,因此从表中可以看出数值较小的两项比数值大的两项先合并。
群集成员
4,5,11,12,16为第二类,13为第三类,其余为第一类。
3群集
1:
1.00
2:
2.00
3:
3.00
4:
4.00
5:
5.00
6:
6.00
7:
7.00
8:
8.00
9:
9.00
10:
10.00
11:
11.00
12:
12.00
13:
13.00
14:
14.00
15:
15.00
16:
16.00
表三说明了聚类的具体情况。
由冰柱图,取值0到3之间,可以被一条直线结成三部分。
左边部分属于第二类,中间部分属于第三类,右边部分为第一类。
方法二:
快速聚类法
1.选择分析---K均值聚类。
2.将s,n,piaochen送入变量选框中。
将code移入个案标记依据。
方法中选择仅分类。
聚类数中填写3。
3.在保存中,选择聚类成员,单击继续。
4在选项中,选择ANOVA表,单击继续。
然后确定。
初始聚类中心
聚类
s
.066
.205
n
.039
.068
piaochen
.102
.264
最终聚类中心
.030
.113
.009
.061
.122
.238
ANOVA
误差
F
Sig.
均方
df
.018
6.616
.010
.005
.000
35.105
.574
.001
422.867
F检验应仅用于描述性目的,因为选中的聚类将被用来最大化不同聚类中的案例间的差别。
观测到的显著性水平并未据此进行更正,因此无法将其解释为是对聚类均值相等这一假设的检验。
每个聚类中的案例数
5.000
10.000
1.000
16.000
4,5,11,12,16为第一类,13为第三类,其余为第二类。