ImageVerifierCode 换一换
格式:DOCX , 页数:7 ,大小:232.82KB ,
资源ID:10746410      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/10746410.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(聚类分析的案例分析.docx)为本站会员(b****8)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

聚类分析的案例分析.docx

1、聚类分析的案例分析应用多元统计分析报告班级: 学号: 姓名:指导教师:聚类分析的案例分析摘要 本文主要用PSS软件对实验数据运用系统聚类法和K均值聚类法进行聚类分析,从而实现聚类分析及其运用。利用聚类分析研究某化工厂周围的几个地区的气体浓度的情况,从而判断出这几个地区的污染程度。 经过聚类分析可以得到,样本6这一地区的气体浓度值最高,污染程度是最严重的,样本3和样本气体浓度较高,污染程度也比较严重,因此要给予及时的控制和改善。关键词:SPS软件 聚类分析 学生成绩一、数学模型 聚类分析的基本思想是认为各个样本与所选择的指标之间存在着不同程度的相似性。可以根据这些相似性把相似程度较高的归为一类,

2、从而对其总体进行分析和总结,判断其之间的差距。 系统聚类法的基本思想是在这几个样本之间定义其之间的距离,在多个变量之间定义其相似系数,距离或者相似系数代表着样本或者变量之间的相似程度。根据相似程度的不同大小,将样本进行归类,将关系较为密切的归为一类,关系较为疏远的后归为一类,用不同的方法将所有的样本都聚到合适的类中,这里我们用的是最近距离法,形成一个聚类树形图,可据此清楚的看出样本的分类情况。 K均值法是将每个样品分配给最近中心的类中,只产生指定类数的聚类结果。 二、数据来源 应用多元统计分析第一版64页第6题 我国山区有一某大型化工厂,在该厂区的邻近地区中挑选其中最具有代表性的8个大气取样点

3、,在固定的时间点每日4次抽取种大气样本,测定其中包含的8个取样点中每种气体的平均浓度,数据如下表。试用聚类分析方法对取样点及大气污染气体进行分类。三、建立数学模型一、运行过程(一)系统聚类分析 在SP界面对上述数据进行系统聚类分析如图1和图所示,进行最近距离分类。图1图2(二)K均值聚类分析 对数据进行K均值聚类分析,如下图所示:图3图4图二、运行结果(一)聚类树形图图 由图可以看出,将数据进行聚类分析,根据设定的分为了二类到三类。若分为两类则样本6为一类,其他为一类;若分为三类则将样本四分离出来,其他分为一类。(二)新变量图7 该图显示将分类结果的新变量,分别为U3_1和CLU_。可以清楚的

4、看到将数据聚为类和3类的分类情况。(三)新变量迭代过程中类中心的变化量迭代历史记录a迭代聚类中心内的更改341.04.42.00.0742.00.000.000.000. 由于聚类中心内没有改动或改动较小而达到收敛。任何中心的最大绝对坐标更改为 .000。当前迭代为 2。初始中心间的最小距离为 .3。图 从表中可以看出本次聚类过程共进行了两次迭代。由于我们在Ierate子对话框中设置最大迭代次数为和收敛判据为0,所以在第二次迭代后,类中心的变化为,从而迭代停止。(四)各观测量所属类成员表聚类成员案例号聚类距离1.04921.074044523.72.0428.00图9(五)最终类中心表最终聚类

5、中心聚类12341.058.066.060.0362.075.07020.1257.551000.0X.060290.200.1650.0397.025020.12900168.851.380.30图10 根据结果(五)和结果(六)可以看出,将8个样本聚为了类。第一类包括样本1、样本2和样本8,根据图中聚类1这一列可以看出,这一类为这四类中气体浓度值最低的一类,也就是说该类的环境污染不严重,属于优;第二类包括样本5和样本,该类气体浓度也是比较低的一类,环境污染有些严重,属于良;第三类包括样本6,这一气体浓度最高,环境污染最严重,属于差;第四类包括样本和样本,环境污染较严重,属于中。(六)新变量 如图所示,QL为分类情况,而CL_2为所属类中心距离。四、结论 通过在SPSS软件中对聚类分析案例的运用将不同的样本聚为不同的类,并算出其间的距离更加清楚方便的将多项不同的样本进行聚类分析,并对其的总体情况进行估计,最后能够得到各类别的气体浓度总体情况,从而判断出环境污染的严重情况。经过这次实验学到了很多东西,遇到的问题也一一得到解决。

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1