1、多元统计分析大气污染的聚类聚类分析(大气污染的聚类)某城市的环保监测站在全市16个监测点抽取大气中二氧化硫、氮氧化物和飘尘的含量。试用几种聚类方法进行聚类分析,并给出综合的分析结果。序号二氧化硫氮氧化物飘尘10.0450.0430.26520.0660.0390.26430.0940.0610.19440.0030.0030.10250.0480.0150.10660.210.0660.26370.0860.0720.27480.1960.0720.21190.1870.0820.301100.0530.060.209110.020.0080.112120.0350.0150.17130.20
2、50.0681.284140.0880.0580.215150.1010.0520.181160.0450.0050.122聚类分析:录入数据方法一:分层(系统)聚类按Analyze(分析)Classify(分类)Hierarchical Cluster(系统聚类)顺序,单击菜单项,展开Hierarchical Cluster Analysis(系统聚类)分析对话框。选择s,n,piaochen这3个变量为分析变量,移到Variables(变量)框中。选择code作为标识变量,移到Label Cases(标注个案)框中。在Cluster(分群)栏中选择系统默认的Cases(个案)项。选中Sta
3、tistics(统计量)复选项,单击Statistics(统计量)按钮,展开统计量选择对话框,进行下列选择:选中Agglomenration schedule,Proximity matrix(合并进程表,相似性矩阵)。在Cluster membership(聚类成员)栏中选择Single solution(单一方案),并在其后的小矩形框中输入“3”。然后继续。在选中Plots(绘图)复选项,单击Plots(绘图)按钮,进行下列选择:选中Dendrogram(树状图).在Icicle(冰柱)栏中选择聚类的指定全距,并在下面的三个小矩形框中填入数字:开始聚类:1,停止聚类:3,到:1。单击主对话
4、框中的Method(方法)按钮,打开Method(方法)对话框在Cluster Method(聚类方法)参数框中选择Furthest neighbor(最远邻元素).在度量栏中选择区间,下拉列表中选择Squared Euclidean distance项。在Transform Value(转换度量)栏中选择标准化方法。在Standardize(转换值)列表中选择range 0 to 1项。选择按照变量项。在主对话框中按Save(保存)按钮,选择Cluster Membership(聚类成员)框中的Single solution(单一方案)项,在Number of clusters聚类数)后的小
5、矩形框中输入3.在主对话框中按OK(确定)按钮,提交运行。案例处理摘要a案例有效缺失合计N百分比N百分比N百分比16100.0%0.0%16100.0%a. 平方 Euclidean 距离 已使用表一说明有16个值,没有缺失值。聚类表阶群集组合系数首次出现阶群集下一阶群集 1群集 2群集 1群集 21314.0030062512.0070073411.0110010468.012009512.01300126315.01410117516.02020108710.0520011969.05440131045.07037151137.07668121213.184511131316.720129
6、14141131.4411301515142.62914100表二是聚类过程的输出。由于选择了欧式距离平方作为距离测度,因此从表中可以看出数值较小的两项比数值大的两项先合并。群集成员案例4,5,11,12,16为第二类,13为第三类,其余为第一类。3 群集1: 1.00 12: 2.00 13: 3.00 14: 4.00 25: 5.00 26: 6.00 17: 7.00 18: 8.00 19: 9.00 110: 10.00 111: 11.00 212: 12.00 213: 13.00 314: 14.00 115: 15.00 116: 16.00 2表三说明了聚类的具体情况。由
7、冰柱图,取值0到3之间,可以被一条直线结成三部分。左边部分属于第二类,中间部分属于第三类,右边部分为第一类。方法二:快速聚类法1.选择分析-K均值聚类。2.将s,n,piaochen送入变量选框中。将code移入个案标记依据。方法中选择仅分类。聚类数中填写3。3.在保存中,选择聚类成员,单击继续。4在选项中,选择ANOVA表,单击继续。然后确定。初始聚类中心聚类123s.003.066.205n.003.039.068piaochen.102.2641.284最终聚类中心聚类123s.030.113.205n.009.061.068piaochen.122.2381.284ANOVA聚类误差FSig.均方df均方dfs.0182.003136.616.010n.0052.0001335.105.000piaochen.5742.00113422.867.000F 检验应仅用于描述性目的,因为选中的聚类将被用来最大化不同聚类中的案例间的差别。观测到的显著性水平并未据此进行更正,因此无法将其解释为是对聚类均值相等这一假设的检验。每个聚类中的案例数聚类15.000210.00031.000有效16.000缺失.0004,5,11,12,16为第一类,13为第三类,其余为第二类。
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1