基于统计检验指导的聚类分析方法_精品文档资料下载.pdf
《基于统计检验指导的聚类分析方法_精品文档资料下载.pdf》由会员分享,可在线阅读,更多相关《基于统计检验指导的聚类分析方法_精品文档资料下载.pdf(7页珍藏版)》请在冰豆网上搜索。
第卷第期电子科学学刊犯是为穷类合结题此析杂度不随样本集的增大而剧烈变化因此实现简单运算量较小尤其适合大数据量样本集的分析处理以下,第节引入单峰分布模式的统计检验,第节介绍基于目标函数的聚类算法,第节为本文提出的模式分析自动机,第节给出实验结果和讨论,最后是结论单峰分布模式的统计检验问题表述设模式集,二,纵尹是维实数空间砂中的一个未标记的子集,二,概尸称为特征矢量或模式矢量,为矢量、的第个特征那么,按照模式产生的统计模型,概率密度可将是可以从集合中导出的唯一特性,当为多类模式的集合时,抓为多峰的当为单一类模式的集合时,抓为单峰的而各种聚类算法都可以归结为域峰态的间接分解,即,艺了、,一一收到,一一定稿国家自然科学基金资助课题1994-2008ChinaAcademicJournalElectronicPublishingHouse.Allrightsreserved.http:
@#@/期高新波等基于统计检验指导的聚类分析方法独立地在抽样域内设置了个抽样始点便可以做出统计量式分析表明当全时,统计量几良好地服从正态分布,即几、,二二介题几斌斌妞徽式。
@#@抽样抽点图二维空间中手抽样原理模式。
@#@抽样始点曾广周把二维平方抽样原理扩展到沙全维情况,把统计量几推广为工,在不改变空间泊松过程的条件下仍服从正态分布,并证明统计量兀在半数框架即抽样始点在以模式质心为中心,包含一半模式的圆内选取的制约条件下,对特1994-2008ChinaAcademicJournalElectronicPublishingHouse.Allrightsreserved.http:
@#@/是最早提的类内均方标数先被来定义硬均值算法。
@#@后来,引入了模糊集理论,把,推广到几,并提出了模糊均值算法。
@#@又把几,。
@#@推广到了一个目标函数的无限簇,定义了如下的目标函数人,艺艺引一咧,笆乞其中为模糊划分矩阵,。
@#@灯表示,属于第乞类的隶属度二。
@#@,珑为各类模式的聚类中心,一为某种范数,表示与间的距离为模糊加权指数,越大则模式划分的模糊度越大,而冉时则退化为硬聚类算法,的经验值为区间,对式目标函数的极小化所得到的模式划分即为最终的分类结果围绕目标函数的优化问题,目前主要形成了三大研究方向一是基于迭代的爬山法或梯度下降法,如和等算法二是借助神经网络的并行实现方法,以提高算法的收敛速度,最著名的如的自组织特征映射网络和的自适应共振网络三是结合进化计算的优化方法,以获得全局最优解,如模拟退火算法、遗传算法、进化策略及搜索等方法1994-2008ChinaAcademicJournalElectronicPublishingHouse.Allrightsreserved.http:
@#@/期高新波等基于统计检验指导的聚类分析方法但是,上述算法均要求聚类数事先给定,而且一旦。
@#@给定,就会以类内均方误差和最小准则,对样本集进行最优划分,获得。
@#@个子集,算法不管数据集是否有类分性,也不管分成类是否合适因此,这些算法都是一种条件最佳分类,即在聚类数给定的条件下的球含的域即为抽样始点设域卜邻模式几允许在球外找算法二显著性检验在给定模式集中建立半数框架。
@#@,令在球,的中随机设置个抽样始点,并计算标准化的统计量八衅劝叮可一如果八七到,则吕,其中为选定的显著水平,到为相应的临界值,可由标准正态分布表中查出,例如二重复,步次一般取二,计算检验大小了二,如果了,则认为为多峰分布模式,具有可分性,反之如果万与相比拟,则认为为单峰模式在获知模式集具有类分性后,首先令,用现有的聚类算法获得的划分这里要求算法要收敛到最优解,否则将影响后续工作。
@#@而基于目标函数的聚类算法对初始点敏感,容易陷入局部极值点而得不到最优的分类结果为此,人们已经提出了多种获得全局最优解的聚类方法,其中有借助数学形态学或者势函数的初始化方法,有的利用进化计算进行全局优化等等这里可根据实际需要选择合适聚类分析方法比如可以1994-2008ChinaAcademicJournalElectronicPublishingHouse.Allrightsreserved.http:
@#@/电子科学学刊卷于是算法从开始进行聚类分析并对所得到的每个聚类分别进行单峰检验不满足检验则令二重新聚类,直到二时,所得到的子集才全部通过、显著性检验,分类结果如图所示,此时各个聚类皆为单峰分布的子集。
@#@成卜事嘴琴美,今萝今二斌荞渗图待分析的模式样本集图峰态分解完全后所得到分类结果表给出了取不同值时,各个聚类进行及统计检验中得到的第一类错误的最大值,即为最大检验大小万,其中对二,无取到不同值的及统计检验结果均表明直到取时各类才均满足二显著性检验,而对应于不同无值的检验大小又反映出在1994-2008ChinaAcademicJournalElectronicPublishingHouse.Allrightsreserved.http:
@#@/期高新波等基于统计检验指导的聚类分析方法一凡凡凡图在聚类中心上构造的最小生成树图模式分析自动机输出的类分谱系图按照上述步骤,对于给定的模式样本集,本文提出的模式分析自动机能够自动、合理而有效地给出特征样本集在不同层次上的类分结果,并且给出不同模式子集之间的亲疏关系,充分显示了该方法的有效性结束语为了对数据集进行综合分析,同时处理非监督模式分析中聚类趋势、聚类分析和聚类有效性等三个关键间题,本文提出基于统计检验指导的聚类分析方法该方法自动检验祥本集的聚类趋势,如果不存在聚类结构,则停止对样本集的聚类,以避免算法应用不适当所造成的评价聚类结果有效性的困难反之则利用现有聚类算法在不同聚类数下分别进行聚类分析,直到所得到的每个聚类的模式分布满足单峰统计检验,最后利用最小生成树技术进行聚类的合并,得到模式集的类分谱系图为了辨识模式在特征空间中的单峰分布,曾光周把和提出的统计量几推广到维,我们又把它推广到卜近邻距离的统计量几,在半数框架的制约下,及一统计量对均匀分布的模式能够建立可信的检验基础,而对单一高斯模式有极低的功效检验,从而可以用来检验单峰分布的模式集利用此性质,可以指导模式集分布的峰态分解,直到把模式集分解成单峰分布的模式子集1994-2008ChinaAcademicJournalElectronicPublishingHouse.Allrightsreserved.http:
@#@/执吮二乞夕,、,年生,博士生,主要研究方向有模式识别、图象处理、模糊信息处理和人工智能年生,讲师,主要研究方向有信号处理、模式识别、图象处理和模糊信息处理年生,教授,博士生导师,主要研究方向有信号处理、模式识别和智能信息处理男男男高新波裴继红谢维信口勿1994-2008ChinaAcademicJournalElectronicPublishingHouse.Allrightsreserved.http:
@#@/