ImageVerifierCode 换一换
格式:DOCX , 页数:22 ,大小:227.34KB ,
资源ID:8763752      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/8763752.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(对数据进行聚类分析实验报告.docx)为本站会员(b****7)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

对数据进行聚类分析实验报告.docx

1、对数据进行聚类分析实验报告对数据进行聚类分析实验报告徐远东 任争刚 权荣一、大体要求用、和/或的数据作为本次实验利用的样本集,利用C均值和分级聚类方式对样本集进行聚类分析,对结果进行分析,从而加深对所学内容的明白得和感性熟悉。二、实验要求1、把和两个文件归并成一个,同时采纳身高和体重数据作为特点,设类别数为2,利用C均值聚类方式对数据进行聚类,并将聚类结果表示在二维平面上。尝试不同初始值对此数据集是不是会造成不同的结果。2、对1中的数据利用C均值聚类方式别离进行两类、三类、四类、五类聚类,画出聚类指标与类别数之间的关系曲线,探讨是不是能够确信出合理的类别数量。3、对1中的数据利用分级聚类方式进

2、行聚类,分析聚类结果,体会分级聚类方式。4、利用数据或把的数据与上述1中的数据归并在一路,重复上述实验,考察结果是不是有转变,对观看到的现象进行分析,写出体会三、实验步骤及流程图依照以上实验要求,本次实验咱们将分为两组:一、第一对FEMALE 与MALE中数据组成的样本依照上面要求用C均值法进行聚类分析,然后对FEMALE、MALE、test2中数据组成的样本集用C均值法进行聚类分析,比较二者结果。二、将上述两个样本用分即聚类方式进行聚类,观看聚类结果。并将两种聚类结果进行比较。一、(1)、C均值算法思想 C均值算法第一取定C个类别和选取C个初始聚类中心,按最小距离原那么将各模式分派到C类中的

3、某一类,以后不断地计算类心和调整各模式的类别,最终使各模式到其判属类别中心的距离平方之和最小(2)、实验步骤第一步:确信类别数C,并选择C个初始聚类中心。本次实验,咱们别离将C的值取为2和3。用的是凭体会选择代表点的方式。比如:在样本数为N时,分为两类时,取第一个点和第个点作为代表点;分为三类时,取第一、个点作为代表点;第二步:将待聚类的样本集中的样本逐个按最小距离规那么分划给C个类中的某一类。第三步:计算从头聚类后的个各类心,即各类的均值向量。第四步:若是从头取得的类别的类心与上一次迭代的类心相等,那么终止迭代,不然转至第二步。第五步:迭代终止时,换不同的初始值进行实验,将实验结果进行比较(

4、3)、实验流程图(4)、本次实验咱们用的聚类指标是误差平方和聚类准那么Je设是第聚类的样本数量,是这些样本的均值,那么把中得各样本与均值间的误差平方和对所有类相加后为:当C取不同的值时各自算出它们的,进行比较。二、利用分级聚类方式进行聚类一、分级聚类法思想:第一把全数样本作为一类看做一类,然后依照必然的目标函数进行分解。二、步骤第一步:开始时,将全数样本当做一类,第二类即为空集。第二步:将第一类中的第一个样本放入第二类,计算两类样本均值, ,并确信两类别中样本数量N1,N2和目标函数第三步:将第一类中剩下的所有样本依次放入第二类中,依照上面运算得出E值,并比较E值大小,选择是E值最大的样本,将

5、其归入第二类。并记录现在的E为E(2)第三步:将新的两类依照上面的方式继续划分,直到第i次迭代的E(i)E(i-1)或抵达规定的迭代次数。3、实验流程图四、实验结果、一、用和中的数据组合起来作为样本集:C=2时(1)、取第一个和第五十一个样本作为初始聚类中心,得出的实验结果图如下:取得结果是:星号表示的类别中样本总数为61,点表示的类别中样本总数为39 。两个聚类中心别离为:z1 =(,),z2 =(,)(2)、取第二十五个和七十五个样本作为初始聚类中心时取得的实验结果如下:最终取得的两个聚类中心别离为:z1 =(,),z2 =(,)结果可发觉取不同的初始聚类中心时两次实验结果相同。它们的=+

6、003可是,通事后面的实验咱们发觉,随着C变大,选取不同的初值对聚类结果有较大阻碍,当C=2时阻碍很小,几乎能够不计。因为当分为两类时,样本的类别特点很明显,因此现在选取不同的初值对聚类结果没有阻碍,而随着C 的增加,初值选择对聚类结果影响将会逐渐变大。下面是将男女样本所代表的点别离画到图上可得以下图:其中点表示的是女生样本,圆圈表示的是男生样本。其中,男生的样本均值为( ,)女生的样本均值为( ,)通过比较两幅图,能够发觉,当去C=2时,对数据进行聚类分析取得的聚类结果大体类似于男女生分类,他们的样本均值相差不大,只是仍是有必然不同。不同出此刻一些身高低于米的男生处。C=3时取得的聚类结果图

7、如下:最终的三个聚类中心:z1 =(,)z2 =(,)z3 =(,)=+003从图中能够看出,当划分为三类时,其结果能够看做依照身高与体重的比将样本进行聚类,身高体重比大,较大,小的别离为一类。C=4时:取得的分来结果如下:取得的四个聚类中心为:z1 =(,),z2 =(,)z3 =(,),z4 =(,)=+003C=5时取得的聚类结果如下:最终的五个聚类中心别离为:z1 =(,),z2 =(,),z3 =(,)z4 =(,)z5 =(,)=+003C=6时取得的聚类结果如下:最终的6个聚类中心别离为:z1 =(,),z2 =(,)z3 =(,)z4 =(,)z5 =(,)z6 =(,)= +

8、0031、画出C值与之间的关系曲线如下:由图能够看出,在 C=5之后,的减小变得缓慢,因此讲此样本集聚为五类最合理2、把的数据与上述1中的数据归并在一路,重复上述实验,实验结果如下:(1)、取第二十五个和第二百零一个个样本作为初始聚类中心,得出的实验结果图其中, z1 =(,),z2 =(,)=+004分为一类时的为+004取第一百个和第三百个样本作为初始聚类中心时得出结果与前面相同。(2)、C=3z1 =(,)z2 =(,)z3 =( ,) =+004(3)、C=4时:=+004z1 =(,),z2 =( ,)z3 =(,),z4 =(,)(4)C=5时:=+004z1 =(,),z2 =(

9、 ,)z3 =(,),z4 =(,)z5 =(,(5)、C=6时其中,= +004z1 =(,)z2 =(,)z3 =(,)z4 =(,)z5 =(,),z6 =(,)画出C值与之间的关系曲线如下与图可知,在C=5以后,的转变缓慢,因此以为现在仍是将样本集分为五类最适合(4)、将两种样本即进行聚类后的样本中心进行比较,如下表:样本C以FEMALE和MALE中得数据作为样本以FEMALE和MALE以及test2中的数据作为样本2z1 =(,)z2 =(,)z1 =(,),z2 =(,)3z1 =(,)z2 =(,)z3 =(,)z1 =(,)z2 =(,)z3 =( ,)4z1 =(,)z2 =

10、(,)z3 =(,)z4 =(,)z1 =(,),z2 =( ,)z3 =(,),z4 =(,)5z1 =(,)z2 =(,)z3 =(,)z4 =(,)z5 =(,)z1 =(,),z2 =( ,)z3 =(,),z4 =(,)z5 =(,6z1 =(,),z2 =(,)z3 =(,)z4 =(,)z5 =(,)z6 =(,)z1 =(,)z2 =(,)z3 =(,)z4 =(,)z5 =(,),z6 =(,)从上表能够纵向比较能够看出,C越大,即聚类数量越多,聚类之间不同越小,他们的聚类中心也越接近。横向比较用FEMALE,MALE中数据作为样本和用FEMALE,MALE,test2中数据

11、作为样本时,由于引入了新的样本,能够发觉后者的聚类中心比前者都稍大。可是它们的散布类似,转变不大。、将两个样本别离用分级聚类方式进行聚类,得出结果,并与C均值聚类法进行比较:1、对FEMALE与MALE中数据组成的样本集进行聚类:由图可见,分即聚类法将样本分为两类,它们的聚类中心别离为x1 =(, )x2 =(,)将它与C=2时的C均值聚类结果进行比较,别离比较它们的结果图和聚类中心,下面是它们的聚类中心比较:聚类方法C均值聚类分即聚类聚类中心z1 =(,)z2 =(,)x1 =(,)x2 =(,)比较发觉它们的聚类结果很相似。二、对由MALE、MALE、test2中数据组成的样本集进行分级类

12、:由图可见,分即聚类法将样本分为两类,它们的聚类中心别离为x1 =(,),x2 =(,)将它与C=2时的C均值聚类结果进行比较,别离比较它们的结果图和聚类中心,下面是它们的聚类中心比较:聚类方法C均值聚类分即聚类聚类中心z1 =(,),z2 =(,)x1 =(,),x2 =(,)比较发觉它们的聚类结果也很类似分析:比较发觉利用分即聚类方式与利用C均值聚类法时C取2时的聚类结果极为相似,可是,从误差平方和角度考虑,利用C均值聚类时C=2并非是最好的聚类结果,C=5时,才是最好的分类,由此可见,从误差平方和角度考虑,C均值聚类法比分即聚类法更优。五、心得体会通过本次实验,咱们队C均值聚类法和分即聚类法都有了较好的明白得,而且在用MATLAB编程方面都有了专门大进步。

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1