模糊ISODATA聚类PPT文档格式.pptx
《模糊ISODATA聚类PPT文档格式.pptx》由会员分享,可在线阅读,更多相关《模糊ISODATA聚类PPT文档格式.pptx(22页珍藏版)》请在冰豆网上搜索。
![模糊ISODATA聚类PPT文档格式.pptx](https://file1.bdocx.com/fileroot1/2022-10/9/2850b578-7ab1-47fc-9662-3971469d75e9/2850b578-7ab1-47fc-9662-3971469d75e91.gif)
通过不断修改聚类中心的位置来进行分类。
1976年J.C.Bezdek把Dunn的方法推广到更一般的情形,并得到了一些有益的结论,其中包括新的判据,隶属度函数与聚类中心的计算公式。
Bezdek于1979年用W.Zangwill的理论证明了FuzzyISODATA的收敛性。
该方法已在行星跟踪系统,心脏病分析和天气预报等方面得到了应用。
二二.模糊模糊ISODATA算法的基本原理算法的基本原理J.C.Bezdek在普通分类基础上,利用模糊集合的概念提出了模糊分类问题。
认为被分类对象集合中的样本以一定的隶属度属于某一类,即所有的样本都分别以不同的隶属度属于某一类。
因此每一类就被认为是样本集上的一个模糊子集,于是,每一种这样的分类结果所对应的分类矩阵,就是一个模糊矩阵。
模糊ISODATA聚类方法从选择的初始聚类中心出发,根据目标函数,用数学迭代计算的方法反复修改模糊矩阵和聚类中心,并对类别进行合并、分解和删除等操作,直到合理为止。
二二.模糊模糊ISODATA算法的基本原理算法的基本原理设有限样本集(论域),每一个样本有s个特征。
即样本的特征的矩阵:
欲把它分为类,则N个样本划分为K类的模糊分类矩阵为:
二二.模糊模糊ISODATA算法的基本原理算法的基本原理其满足下列三个条件:
、条件表明每一样本属于各类的隶属度之和为1;
条件表明每一类模糊集不可能是空集合,即总有样本不同程度的隶属于某类。
定义K个聚类中心。
其中。
二二.模糊模糊ISODATA算法的基本原理算法的基本原理第i类的中心即人为假想的理想样本,它对应的s个指标值是该类样本所对应的指标值的平均值:
构造准则函数:
其中,表示第j个样本与第i类中心之间的欧式距离;
J表示所有待聚类样本与所属类的聚类中心之间距离的平方和。
为了确定最佳分类结果,就是寻求最佳划分矩阵U和对应的聚类中心Z,使J达到极小。
Dunn证明了求上述泛函的极小值的问题可解。
三三.模糊模糊ISODATA算法的基本步骤算法的基本步骤(11)选择初始聚类中心)选择初始聚类中心(22)计算初始隶属度矩阵)计算初始隶属度矩阵(33)求各类的新的聚类中心)求各类的新的聚类中心(44)计算新的隶属度矩阵)计算新的隶属度矩阵(55)回到第()回到第(33)步,重复至收敛)步,重复至收敛(66)类别调整)类别调整合并合并删除删除分解分解三三.模糊模糊ISODATA算法的基本步骤算法的基本步骤三三.模糊模糊ISODATA算法的基本步骤算法的基本步骤(6)类别调整分裂对于类的第j个特征,模糊化方差的计算公式为,全体的平均值记作,然后求阈值对于任一不满足的类考虑其每个,若,便在第j个特征方向上对聚类中心加和减,得到两个新的聚类中心。
三三.模糊模糊ISODATA算法的基本步骤算法的基本步骤(6)类别调整删除条件条件11:
条件条件22:
但但类不满足分解条件,即对所有的类不满足分解条件,即对所有的jj,符合以上两个条件之一者,将被删除。
符合以上两个条件之一者,将被删除。
四四.模糊模糊ISODATA算法程序算法程序实现实现设定参数设定参数结束结束开始开始选择初始聚类中心选择初始聚类中心计算初始隶属度矩阵计算初始隶属度矩阵求各类的新的聚类中心求各类的新的聚类中心计算新的隶属度矩阵计算新的隶属度矩阵类别调整:
类别调整:
合并、分解或删除合并、分解或删除分类清晰化分类清晰化NYYN四四.模糊模糊ISODATA算法程序算法程序实现实现重要程序代码这里对酒瓶颜色进行分类。
下面介绍其重要程序代码:
1)调节参数初始化lNc=4;
%初始聚类中心数目lm=2;
%控制聚类结果模糊程度lL=0;
%迭代次数lLmax=1000;
%最大迭代次数lNc_all=ones(Lmax,2);
%各次迭代的分类数lUdmax=10;
%最后一次的隶属度与前一次的隶属度的差值的初始值le=0.00005;
%收敛参数la=0.33;
%合并阈值系数lb=1;
%模糊化方差参数(通常取1)lr=0.1;
%分解阈值参数(算法使用者掌握的参数,控制G(K)的上升速度)lf=0.68;
%隶属度阈值(一般取值0-0.5之间)lAvms=0.83;
%平均隶属度阈值(一般应大于0.5,0.55-0.6之间取值比较适宜)lk_divide=0.9;
%分裂1数(取0-1之间)lw=0.2;
%删除条件参数四四.模糊模糊ISODATA算法程序算法程序实现实现2)FussyISODATA函数模糊ISODATA的函数如下:
functionX,Z,U,Nc,L,Dcc,Dccm,Mind,S,Smean,Fstd,T,C,k_delete,Dpc=FussyISODATA_function(data,Nc,m,L,Lmax,Nc_all,Udmax,e,a,b,r,f,Avms,k_divide,w)l%data样本特征库l%Nc初始聚类中心数目l%m控制聚类结果模糊程度l%L迭代次数l%Lmax最大迭代次数l%Nc_all各次迭代的分类数l%Udmax最后一次的隶属度与前一次的隶属度的差值的初始值l%e收敛参数l%a合并阈值系数l%b模糊化方差参数l%r分解阈值参数四四.模糊模糊ISODATA算法程序算法程序实现实现l%f隶属度阈值l%Avms平均隶属度阈值l%k_divide分裂系数l%w删除条件参数l%返回值:
l%X样本结构体数组:
样本特征、所属类别l%Z聚类中心结构体数组:
聚类中心特征、所属类别及其包含的样本数l%U隶属度矩阵l%Nc聚类中心数目l%L迭代次数l%Dcc两两聚类中心之间的距离矩阵l%Dccm两两聚类中心之间的距离的平均值l%Mind合并阈值l%S各类在每个特征方向上的模糊化标准差矩阵l%Smean模糊化标准差平均值l%Fstd分解阈值l%T各类超过隶属度阈值f的样本数矩阵l%C各类的聚集程度矩阵l%k_delete删除阈值l%Dpc各样本点到各聚类中心的距离矩阵四四.模糊模糊ISODATA算法程序算法程序实现实现3)聚类函数functionZ,U,Nc,Nc_all,L,Dpc=FussyISODATA_newcentre(X,Z,U,Nc,Nc_all,Np,Nq,e,m,L,Lmax,Udmax)l%名称:
FussyISODATA_newcentrel%参数:
聚类中心特征、所属类别及其包含的样本数l%U隶属度矩阵l%Nc聚类中心数目l%Nc_all各次迭代的分类数l%Np样本数目l%Nq样本维数l%e收敛参数l%m控制聚类结果模糊程度l%L迭代次数四四.模糊模糊ISODATA算法程序算法程序实现实现l%Lmax最大迭代次数l%Udmax最后一次的隶属度与前一次的隶属度的差值的初始值l%返回值:
l%Z聚类中心结构体数组:
聚类中心特征、所属类别及其包含的样本数l%U隶属度矩阵l%Nc聚类中心数目l%Nc_all各次迭代的分类数l%L迭代次数l%Dpc各样本点到各聚类中心的距离矩阵l%功能:
l%重复计算新的隶属度矩阵及聚类中心,直至收敛四四.模糊模糊ISODATA算法程序算法程序实现实现4)类别调整函数functionZ,U,Nc,Dcc,Dccm,Mind,S,Smean,Fstd,T,C,k_delete=FussyISODATA_adjust(X,Z,U,Nc,Np,Nq,a,f,Avms,b,r,k_divide,w)l%名称:
FussyISODATA_adjustl%参数:
聚类中心特征、所属类别及其包含的样本数l%U隶属度矩阵l%Nc聚类中心数目l%Np样本数目l%Nq样本维数l%a合并阈值系数l%f隶属度阈值l%Avms平均隶属度阈值l%b模糊化方差参数四四.模糊模糊ISODATA算法程序算法程序实现实现l%r分解阈值参数l%k_divide分裂系数l%w删除条件参数l%返回值:
聚类中心特征、所属类别及其包含的样本数l%U隶属度矩阵l%Nc聚类中心数目l%Dcc两两聚类中心之间的距离矩阵l%Dccm两两聚类中心之间的距离的平均值l%Mind合并阈值l%S各类在每个特征方向上的模糊化标准差矩阵l%Smean模糊化标准差平均值l%Fstd分解阈值l%T各类超过隶属度阈值f的样本数矩阵l%C各类的聚集程度矩阵l%k_delete删除阈值l%功能:
l%调整聚类结果:
合并、分解、或者删除四四.模糊模糊ISODATA算法程序算法程序实现实现本文对酒瓶颜色进行分类,以59组数据为对象,程序运行完之后,出现如图所示59组数据分类图。
四四.模糊模糊ISODATA算法程序算法程序实现实现MATLAB的运行结果如下:
A=1.0e+03*1.74431.75191.94950.31203.21362.25062.29403.15691.00361.25531.83402.9638B=1至27列12142413221223341331132341228至54列22114123312411432321233114455至59列24111其中A为聚类中心,B为分类结果。
五五.总结总结模糊ISODATA聚类分析方法对特性比较复杂而人们又缺少认识的对象进行分类,可以有效地实施人工干预,加入人脑思维信息,使分类结果更符合客观实际,可以给出相对的最优分类结果,因而具有一定的实用性。
然而由于该方法在计算中需要人为选择和确定不同的参数,使该方法在数学理论上显得不够严谨。
参数的选取也缺乏理论依据,选取最合适的参数也非常困难。
这些参数的设定问题,直接影响到模糊分类的分类精度和算法实现,使FuzzyISODATA算法在实际应用中受到限制。