ImageVerifierCode 换一换
格式:DOCX , 页数:12 ,大小:177.35KB ,
资源ID:18836976      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/18836976.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(Iris数据简单分类文档格式.docx)为本站会员(b****5)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

Iris数据简单分类文档格式.docx

1、最初为150类,依据欧氏距离,最终分为3类,图形显示三类。2)C-均值聚类法:不同的初始聚类中心,a)前三个,b)后三个,c)第1、51、101个,d)前50平均值、中间50平均值、后50平均值计算不同方法获得的分类结果,最终分为3类,图形显示三类。3)对比批量处理法和单样本修正法的结果。二、方法原理1、数据标准化 数据标准化有两个直接目的,一是消除量纲的影响,二是同一各特征的影响度。比较常用的标准化方法是零均值处理和单位方差处理。 零均值处理的计算公式为: 单位方差处理的计算公式为:2、聚类准则聚类准则可以评价聚类结果的好坏,误差平方和准则是常用的一种聚类准则。误差平方和准则计算公式如下:,

2、其中其中C代表聚类数,ni是第i类中的样本数。Je取值越小,表明聚类结果越好。计算误差平方和准则Je的程序如下:function output=Je_SquareError(classy_result)classy_n=length(classy_result);%元胞中元素个数,classy_dimensions=size(classy_result1);%每个元素的维度classy_mean=zeros(classy_n,classy_dimensions);Je=zeros(classy_n,1);for i=1:classy_n classy_mean(i,:)=mean(classy

3、_resulti,1);%每个元素的均值 h=pdist2(classy_resulti,classy_mean(i,:);%每个点到均值点的距离 Je(i)=h*h;%距离平方和endoutput=sum(Je);3、聚类算法 聚类算法有非迭代算法和迭代算法两种类型。1)非迭代算法中常用的是分级聚类法,算法开始时将每条数据视为一级,每次循环依据最小距离合并一级,并用均值点作为新级的内容,直到级数减小到要求的分类数退出循环,实现聚类效果。分级聚类法的算法流程图如下:图1 分级聚类算法流程图分级聚类法程序:%分级聚类函数%A是原始数据,a为期望的类别数function output=Hierar

4、chical_cluster(A,a)orginal_data=A;classy_n=a;%最终的分类数classy_result=cell(classy_n,1);%最后的返回结果orginal_number,=size(orginal_data);%原数据数量,原数据维度current_n=orginal_number;%当下的类别数current_data=orginal_data;%当下的数据current_data_No=cell(current_n,1);orginal_number current_data_Noi=i;%存放每个类别中的数据对应的原始数据中的序号while (c

5、urrent_nclassy_n) %寻找距离最近的两个级 pdist_diag=ones(1,current_n)*100000; pdist_data=squareform(pdist(current_data)+diag(pdist_diag);%距离 min_data=min(min(pdist_data); i_data,j_data=find(pdist_data=min_data); mini_data=i_data(1);%mini_data,minj_data即为数据中相邻最近的两个数据minj_data=j_data(1);%记录并合并最近两个点所在级中对应的原始数据中的序

6、号new_data_No=current_data_Nomini_data current_data_Nominj_data; %删除旧级,增加新级,%用新级代替一个旧级current_data(mini_data,:)=(current_data(mini_data,:)+current_data(minj_data,:)/2;current_data_Nomini_data=new_data_No; current_data(minj_data,:)=;%删除一个旧级 current_data_No(minj_data)=; current_n=current_n-1;%减少一级 clas

7、sy_resulti=orginal_data(current_data_Noi,:);output=classy_result;2)迭代算法中常用的是C均值法,根据C个中心点一句最小距离法将数据分为C类,然后迭代计算中心点,重新进行分类直到中心点不再发生变化,即完成聚类运算。单样本处理和批量样本处理C均值聚类法的算法流程图如下:图2 C均值聚类算法C均值分类算法:%动态聚类法%A是原始数据%a为期望的类别数%b是选择初始中心的方式,%c是选择处理方式,0代表批处理方式,1道标单样本修正方式function output=Dynamical_cluster(A,a,b,c)Center_met

8、hond=b;Train_methond=c;orginal_number,orginal_imensions=size(orginal_data);Center=zeros(classy_n,orginal_imensions);%选取初始中心点,需要保证这三个点不一样i=0;while(length(unique(Center,rows)0%计算新的均值点 Center(j,:)=mean(orginal_data(class_ever=j,: %判断中心点有无变化n_flag=length(nonzeros(class_ever_last-class_ever); if n_flag c

9、lass_ever_last=class_ever; else flag=0;%中心点不再变化 classy_resulti=orginal_data(class_ever=i,:三、结果结论根据上一个作业,选取特征三、四进行分类效果较好。对选取特征三、四的Iris数据进行聚类结果如下1、不分类图像图3 Iris数据特征3、4不分类展示2、分级聚类结果图4 分级聚类结果3、C均值聚类结果 1)选取后三个连续且互不相同的数据作为初始中心点聚类结果:图5 第一种初始中心点C均值聚类结果2)选取后三个连续且互不相同的数据作为初始中心点聚类结果:图6第二种初始中心点C均值聚类结果3)选取第1、51、1

10、51个数据作为初始中心点聚类结果:图7 第三种初始中心点C均值聚类结果4)选取前50、中间50、后50平均值作为初始中心点,聚类结果如下:图8 第四种初始中心点C均值聚类结果表1各种聚类方法结果比较初始中心选取C均值聚类法分级聚类批量处理单样本处理前三个连续且互不相同的点17.926723.7193后三个连续且互不相同的点第1、51、151个点前50、中50、后50平均点观察以上所有数据,针对选取特征3、4的Iris数据有以下几点发现:(1)在分为3类的前提下,C均值聚类法的效果要优于分级聚类法;(2)对于C均值聚类,初始中心的选取以及中心点的计算方式(即批处理、单样本处理)是不会影响最终的聚类结果的;(3)在测试程序时发现,对于C均值批处理聚类法,初始中心点的选取时应该保证互不相同,否则无法成功的将数据分为C类,这是由批处理的C均值聚类算法特性所导致的。如选取前标准化后的前三个点(-1.3368,-1.3086)、(-1.3368,-1.3086) 、(-1.3935,-1.3086),分类结果如下所示:图9 初始中心有相同点时C均值聚类结果

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1