多元统计分析大气污染的聚类.docx-资源下载

多元统计分析大气污染的聚类.docx

1、多元统计分析大气污染的聚类聚类分析（大气污染的聚类）某城市的环保监测站在全市16个监测点抽取大气中二氧化硫、氮氧化物和飘尘的含量。试用几种聚类方法进行聚类分析，并给出综合的分析结果。序号二氧化硫氮氧化物飘尘10.0450.0430.26520.0660.0390.26430.0940.0610.19440.0030.0030.10250.0480.0150.10660.210.0660.26370.0860.0720.27480.1960.0720.21190.1870.0820.301100.0530.060.209110.020.0080.112120.0350.0150.17130.20

2、50.0681.284140.0880.0580.215150.1010.0520.181160.0450.0050.122聚类分析:录入数据方法一：分层（系统）聚类按Analyze（分析）Classify(分类)Hierarchical Cluster(系统聚类)顺序，单击菜单项，展开Hierarchical Cluster Analysis(系统聚类)分析对话框。选择s,n,piaochen这3个变量为分析变量，移到Variables(变量)框中。选择code作为标识变量，移到Label Cases（标注个案）框中。在Cluster（分群）栏中选择系统默认的Cases（个案）项。选中Sta

3、tistics（统计量）复选项，单击Statistics（统计量）按钮，展开统计量选择对话框，进行下列选择：选中Agglomenration schedule,Proximity matrix（合并进程表，相似性矩阵）。在Cluster membership（聚类成员）栏中选择Single solution（单一方案）,并在其后的小矩形框中输入“3”。然后继续。在选中Plots（绘图）复选项，单击Plots（绘图）按钮，进行下列选择：选中Dendrogram(树状图).在Icicle（冰柱）栏中选择聚类的指定全距，并在下面的三个小矩形框中填入数字：开始聚类:1,停止聚类:3,到:1。单击主对话

4、框中的Method（方法）按钮，打开Method（方法）对话框在Cluster Method（聚类方法）参数框中选择Furthest neighbor（最远邻元素）.在度量栏中选择区间,下拉列表中选择Squared Euclidean distance项。在Transform Value（转换度量）栏中选择标准化方法。在Standardize(转换值)列表中选择range 0 to 1项。选择按照变量项。在主对话框中按Save（保存）按钮，选择Cluster Membership（聚类成员）框中的Single solution（单一方案）项，在Number of clusters聚类数）后的小

5、矩形框中输入3.在主对话框中按OK（确定）按钮，提交运行。案例处理摘要a案例有效缺失合计N百分比N百分比N百分比16100.0%0.0%16100.0%a. 平方 Euclidean 距离已使用表一说明有16个值，没有缺失值。聚类表阶群集组合系数首次出现阶群集下一阶群集 1群集 2群集 1群集 21314.0030062512.0070073411.0110010468.012009512.01300126315.01410117516.02020108710.0520011969.05440131045.07037151137.07668121213.184511131316.720129

6、14141131.4411301515142.62914100表二是聚类过程的输出。由于选择了欧式距离平方作为距离测度，因此从表中可以看出数值较小的两项比数值大的两项先合并。群集成员案例4,5,11,12,16为第二类，13为第三类，其余为第一类。3 群集1: 1.00 12: 2.00 13: 3.00 14: 4.00 25: 5.00 26: 6.00 17: 7.00 18: 8.00 19: 9.00 110: 10.00 111: 11.00 212: 12.00 213: 13.00 314: 14.00 115: 15.00 116: 16.00 2表三说明了聚类的具体情况。由

7、冰柱图，取值0到3之间，可以被一条直线结成三部分。左边部分属于第二类，中间部分属于第三类，右边部分为第一类。方法二：快速聚类法1.选择分析-K均值聚类。2.将s，n，piaochen送入变量选框中。将code移入个案标记依据。方法中选择仅分类。聚类数中填写3。3.在保存中，选择聚类成员，单击继续。4在选项中，选择ANOVA表，单击继续。然后确定。初始聚类中心聚类123s.003.066.205n.003.039.068piaochen.102.2641.284最终聚类中心聚类123s.030.113.205n.009.061.068piaochen.122.2381.284ANOVA聚类误差FSig.均方df均方dfs.0182.003136.616.010n.0052.0001335.105.000piaochen.5742.00113422.867.000F 检验应仅用于描述性目的，因为选中的聚类将被用来最大化不同聚类中的案例间的差别。观测到的显著性水平并未据此进行更正，因此无法将其解释为是对聚类均值相等这一假设的检验。每个聚类中的案例数聚类15.000210.00031.000有效16.000缺失.0004,5,11,12,16为第一类，13为第三类，其余为第二类。

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
特别说明：	请自助下载，系统不会自动发送文件的哦；如果您已付费，想二次下载，请登录后访问：我的下载记录
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？