ImageVerifierCode 换一换
格式:DOCX , 页数:10 ,大小:392.03KB ,
资源ID:4564336      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/4564336.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(谱聚类算法及其在图像分割中的应用.docx)为本站会员(b****6)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

谱聚类算法及其在图像分割中的应用.docx

1、谱聚类算法及其在图像分割中的应用谱聚类算法及其在图像分割中的应用1 引言在对图像的研究和应用中, 人们往往仅对图像中的某些部分或者说某些区域 感兴趣。这些部分常称为目标或前景(其他部分称为背景) ,它们一般对应图像 中特定的具有独特性质的区域。 为了辨识和分析目标, 需要将它们从图像中分离 提取出来, 在此基础上才有可能对目标进一步利用。 图像分割就是指把图像分成 各具特性的区域并提取出感兴趣目标的技术和过程。 这里的特性可以是像素的灰 度、颜色和纹理等,预先定义的目标可以对应单个区域,也可以对应多个区域。多年来,对图像分割的研究一直是图像技术研究中的热点和焦点, 它不但是 从图像处理到图像分

2、析的关键步骤 1 ,而且是计算机视觉领域低层次视觉中的主 要问题。图像分割的结果是图像特征提取和识别等图像理解的基础, 只有在图像 被分割后,图像的分析才成为可能。图像分割在实际应用中已得到了广泛的应用, 如图像编码、 模式识别、 位移 估计、目标跟踪、大气图像、军用图像、遥感图像、生物医学图像分析等领域。 同时,图像分割也在计算机视觉和图像识别的各种应用系统中占有相当重要的地 位,它是研制和开发计算机视觉系统、 字符识别和目标自动获取等图像识别和理 解系统首先要解决的问题。 概括地说只要需对图像目标进行提取测量等都离不开 图像分割。对分割算法的研究已经有几十年的历史, 至今借助于各种理论已经

3、提出了数 以千计的分割算法 2 ,而且这方面的研究仍然在积极进行。尽管人们在图像分割 方面做了许多工作, 但至今仍无通用的分割算法, 也不存在一个判断分割是否成 功的客观标准。 因此已经提出的分割算法大都是针对具体问题的, 并没有一种适 合于所有图像的通用的分割算法。 实际上由于不同领域的图像千差万别, 也不可 能存在万能的通用算法。现有的分割算法非常多, 大体上可以分为以下几类: 阈值化分割、 基于边缘 检测的、基于区域的、 基于聚类的和基于一些特定理论工具的分割方法。 从图像 的类型来分最常见的: 有灰度图像分割、 彩色图像分割和纹理图像分割等等。 本 文所要介绍的基于谱聚类的图像分割,

4、是基于聚类分析方法中的一种。 传统的聚 类算法是建立在凸球形的样本空间上, 当样本空间不为凸时, 算法会陷入“局部” 最优。相对于这些传统算法, 谱聚类能在任意形状的样本空间上聚类, 且收敛于 全局最优解。2 谱聚类算法的基本原理聚类分析是模式分类中的经典问题。 它是通过抽取数据的 “潜在” 结构,将 相似数据组成类或类的层次结构。 它不需要先验知识和假设, 故它也称作是无监 督学习。传统的聚类算法主要是k-means算法和EM算法。这些算法都是建立在 凸球形的样本空间上。当样本空间不为凸时,算法会陷入“局部”最优。为了能在任意形状的样本空间上聚类, 且收敛于全局最优解, 研究学者最近 开始利

5、用谱方法来聚类。 谱方法聚类是由数据点间相似关系建立矩阵, 获取该矩 阵的前n个特征向量,并且用它们来聚类不同的数据点。 谱聚类方法建立在图论 中的谱图理论上。 最初,它是用于负载均衡和并行计算, VLSI 等方面, 如 Hagen 和Kahng3将基于ratio-cut的目标函数图划分算法用于 VLSI设计中。最近,学 者们也开始将谱聚类方法用于机器学习中。 Shi和Malik在2000年根据谱图理论建立了 2-way划分的Normalized-Cut(Ncut)的目标函数,设计了用于图像分割 的算法,由此发展出一系列算法:k-way划分的Ncut算法(Ng和WeissL5); Normal

6、ized Cut与随机游动关系的算法(Meila和sh料);基于二分图的算法(Zha 和 Dhillon8 )等。并且,谱聚类方法的应用也开始从图像分割领域扩展到文本挖 掘(DhillonE)和生物信息挖掘领域(Chris Ding9)等领域中。2 1 图划分问题与聚类聚类算法的一般原则是类内样本间的相似度大, 类间样本间的相似度小。 假 定将每个数据样本看作图中的顶点 y,根据样本问的相似度将顶点间的边赋权重 值,就得到一个基于样本相似度的无向加权图: G(V,E)。那么在图G中,我们可将聚类问题转变为如何在图 G 上的图划分问题。划分的原则是:子图内的连 权重最大化和各子图间的边权重最小化

7、。针对这个问题,Shi和MalikEz提出了基于将图划分为两个子图的2-way 目标函数Ncut:.KT z A cui(AiB) j minNcr(AtB)=如 + 右-(1)vol(A) = S(2)FEAi jcui(A,B)= S(3)其中cut(A, B)是子图A , B间的边,又叫“边切集”。从式(1),我们可以看出改进后目标函数不仅满足类间样本间的相似度小,也满足类内样本间的相似度大。assoCA)= S S Wy =vol(A)cut(A9B) (4min Nc说(A,B)=min(2签牆十啜醤) 如果考虑同时划分几个子图的话, 则基于k-way的Normalized-cut目

8、标函数 为:NcugM )= 郛空驾 + 黔辔 除了 Ncut目标函数外,还有 Hagen和Kahng提出的Ratio-Cut和Ding等提出的Min-Max Cut。三个目标函数中,Ratio-Cut只考虑类间相似性最小,且最易 产生“倾斜”的划分。而 Min-Max Cut与Ncut 样满足类内样本问的相似度大 而类间样本的相似度小的原则,与 Ncut具有相似的行为。2. 2谱图理论谱图理论是一个具有很长历史的理论。它是利用矩阵理论和线性代数理论来 研究图的邻接矩阵,根据矩阵的谱来确定图的某些性质。谱图理论分析的基础是 图的Laplacian矩阵,它是Fiedler11 1973提出来的。

9、假设一无向加权图G= ,其表示形式为一对称矩阵: W=Wijn*n,其中Wij表示连接顶点i与j的权值。那么该图的Laplacian矩阵表示为:L=D-W其中,D为对角阵。Laplacian矩阵是对称半正定矩阵,因此它的所有特征 值是实数且是非负的:0=九 =如 =、=入井如果G是c个连接部件,那么L有c个等于0的特征向量。如果 G是连通 的,第二个最小特征值不为0,则它是G的连接代数值(Fiedter-value)。其对应的 特征向量为Fiedler向量。当我们考虑2-way划分时,令P是A的划分指示向量:Pi =那么:CutCA fAe) = /) cut(AfAc) = /(/) =-r

10、- SWg(A /p2 2考虑到约束 ,则min Ncut(1,Ac) = min T (9)将X放松(松弛)到连续域-1,1,获得mi nN Cut的问题就是:根据瑞利商原理,式(10)的优化问题等于下列等式的第二最小特征值的求解问题:D叫(DW)d7 戈=4 (11)对应于第二最小特征值对应的特征向量 X2则包含了图的划分信息。人们可以根据启发式规则在X2寻找划分点i,使得值大于等于X2i的划为一类,而小于 X2i的划为一类。同理,我们可以推理得到 k-way Ncut目标函数式(6)的最优解在 式(11)的是个最小特征值对应的特征向量所组成的子空间上。2 3 算法描述谱聚类算法由三个部分

11、组成: 1建立表示样本集的矩阵 S。2 计算S的k个特征值与特征向量a.2-way:将原始样本数据映射到一维空间(k=1);b.k-way;将原始样本数据映射到由k个正交向量组成的k维空间S3.将k维子空间S的行作为样本的新的数据表示,且基于这种新的表示, 将样本进行聚类。a. 2-way:在一维空间上根据目标函数最优原则划分, 并且在划分好的两个 子图上迭代划分;b.k-way:利用传统的k-means或其它传统聚类算法在是维空间上进行聚类。 上述的描述是算法的一个框架, 在具体的算法中, 不同的算法在数据集矩阵S的表示上存在着不同,女口:根据2-wayNcut的目标函数,S=D-1/2LD

12、-1/2 ;根据随 机游动关系, S=D-1 W 等。3 谱聚类算法在图像分割中的应用谱聚类方法最初是在图像分割中应用 shi和Malik将像素作为顶点,根据 像素的亮度和空间位置确定连接像素点问边的权值, 利用2-wayNcut的谱聚类方 法迭代地进行图的分割。该方法获得了满意的效果。M.Gu,H.Zha 等人10分析了在不规则图上进行 k-way 图划分的谱松散模型, 并且根据该模型,提出了 k-way Ncut与k-way Min-Max cut不同目标函数设置的 下限值,同时分析了对应于最优解的特征空间或单个特征向量的代数结构, 为将 谱图理论运用到k-way图划分问题中,提供了理论基

13、础。Meila和shi将相似性解释为Markov链中的随机游动,分析了这种随机游 动的概率转移矩阵P=D-1W的特征向量(其中:W是相似度矩阵),并且根据随机 游动对 Ncut 进行了概率的解释,提出了基于随机游动的新的算法。同时,在这个解释框架下提出了多个特征相似矩阵组合下的谱聚类方法, 在图像分割中也取 得了很好的效果。Zhd7等人和Dhillon研究了基于二分图G= 上的谱聚类。聚类 目标是使得在最小化二分图上的不匹配顶点对间的边权重和最小, 故目标函数可 以用变形的Ncut表示;滋的严皿)語融丽讦羽罰(12) 将二分图的邻接矩阵 W转换对称矩阵:4叮LW 0然后再根据谱图理论对二分图上

14、划分的目标函数式 (12)进行分析(与2的分析相似)。Zha等人与Dhilion发现最小化目标函数式(12)可以等同于与二分图相 关联的边权重矩阵的奇异值分解。 Dhillonc将其运用到文档聚类中,对 CMU的Newsgroup2 0做了实验,取得了很好的效果。基于二分图模型,该算法同样也可 以用于市场分析中交易-商品的分析,生物信息挖掘中的Gene expression profilesZha等人分析了核k-means的方法,发现最小化核k-means的目标函数等同 于一个由数据向量组成的Gram矩阵的迹最大化问题。同时,迹最大化问题的松 散解可以通过 Gram矩阵的部分特征分解获得。首次

15、用谱松散的方法获得核 k-means的目标函数的全局最优解。 Dhillon11在此基础上,又研究了加权核k-means的目标函数,将其与Ncut目标函数建立联系,提出了一个可以单调递减 Ncut值的新颖的加权核k-means算法。Ncut是一个可行的聚类目标函数。它的求解是一个NP难问题。传统的方法 是宽松的谱松散方法。Xing与Jordan则分析了对Ncut的半正定规划(SDP)模型。 根据该模型,对Ncut提出了一个比谱松散更紧的下限。 同时指出Ncut本身不能 刻画最优的聚类,但它可以通过不同的松散方法获得合理的聚类。图一所示为一种基于PCA加权的Ncut图像分割结果:a.原始图像 b

16、.子采样后训练图像e.前景图像 f. Pepper图像细节图一.基于Ncut的Pepper”图像分割结果由于Ncut算法计算量比较大(为0(n3),尤其在图像的数据量大时更为明显。Uros Damnjanovic和 Ebroul lzquierdo11提出了 Acut 算法,该算法是 Ncut 图像分割算法的一种简化处理。Acut算法只对感兴趣的区域进行处理,仅需要一步就能够提取出图像信息。通过利用两个像素之间和与其相邻像素的相关性来构造这像分割结果如图二所示(d)图二.Acut图像分割结果谱聚类方法不仅用于无监督学习中13,也用于有约束的半监督学习中15。 Kamva6等人将PageRank

17、的随机游动模型运用到相似度矩阵中, 根据已知样本的类别修正相似度矩阵。然后根据谱聚类算法获得聚类结果。 Bach与Jordan则是根据一个基于已知的划分与 Ncut谱松散结果的误差,提出了新的目标函数。通过最小化新的目标函数推出新的谱聚类算法,获得聚类结果。田铮和李小斌17针对谱聚类应用于图像分割时权矩阵的谱难以计算的实际 问题,定义了像素点与类之间的距离,给出一个采样数定理,设计了一个图像的 分层分割(hierarchical divisive)算法.在利用该算法进行图像分割时,由于既要对 待分类的点进行随机抽样,又要通过调节尺度因子来合并较小的类或拆分较大 的类,因此图像的分割既具有随机性

18、又具有多尺度特性,称之为基于谱聚类的图 像多尺 度随机 树分害U (multiscale stochastic hierarchical image segmentation by spectral clustering,简写为 MSHISSC).图三.基于 MSHISSC 与基于 Normalized cut 和 Min-max cut的图像分割算法的比较结果其中第1列是原始图像,第2列是利用MSHISSC得到的分割结果,第3 列是利用Normalized cut到的分割结果,第4列是利用Min-max cut得到的分 割结果。4谱聚类算法中的关键问题和未来的研究方向尽管谱聚类算法具有坚实的

19、理论基础一一谱图理论,并且在实践中也取得了 很好的效果,但是它仍然存在一些关键问题:1 如何构造邻接矩阵w;在谱聚类算法中,边的权值是顶点i与j的相似度 sim(i,j),故表示图的邻接矩阵也是样本空间的相似度矩阵。 相似度矩阵的构造依赖于两个样本间相似度的构造。而单纯地依赖人为选择的相似度函数是带有一定 的局限性的。我们应该引入相关领域知识,学习构造邻接矩阵。2自动地确定聚类的数目:聚类数目的确定对聚类的质量有很大的影响。当聚类数目大于实际聚类数, k-way 谱聚类方法的效果差。因此如何自动地确定 聚类数目是一个关键的问题,是未来研究的方向。3如何解决模糊聚类的问题:尽管在文档聚类中,谱聚

20、类取得了很好的效 果。但是在文档聚类中, 单个词可能属于多个类, 单个文档可能是多主题的文档。 这就需要我们用模糊聚类的方法解决。如何确定基于模糊聚类与谱方法的联合: 如建立模糊标准的图划分的目标函数等,是我们的研究方向。4运用到海量数据中去:当我们用谱聚类,不可避免地要计算矩阵的特征 值与特征向量。 通常这种计算的代价很大, 求解非稀疏矩阵的所有特征向量的标 准解法需要0(n3)。同时当应用到海量数据时,相似度矩阵也很大,可能会超出 计算机的内存。DhillonE在研究了谱聚类和核k-means聚类方法的关系后,将谱 聚类问题用核k-means算法求解,并且运用到核k-means算法的优化技

21、巧,来解 决海量数据的计算。 但该方法只用于非二分图的谱聚类方法, 对二分图的聚类问 题仍然是我们未来的研究方向。参考文献1章毓晋. 图像分割 . 北京: 科学出版社 , 20012Zhang Y J. A Survey on Evaluation Methods for Image Segmentation. PatternRecognition, 1996, 29(8): 133513463Hagen L, Kahng A B. New spectra1 methods for ratio cut partitioning andclusteri ng. IEEE Trans. Compu

22、ter-Aided Desig n, 1992, 11(9):107410854Shi J, Malik JNormalized cuts and image segmentation IEEE Transactions on Pattern Analysis and Machine Intelligence, 2000,22(8):8884 9055Ng A , Jordan M, Weiss YOn spectral clustering :Analysis and an algorithm, Advances in Neural Information Processing System

23、s 14 MIT Press, 2001th6Meila M , Shi JA random walks view of spectra1 segmentation In: 8th International Workshop on Artificia1 Intelligence and Statistics, 20017Zha H, He XDing C, Gu M, Simon H D. Bipartite Graph Partitioning and Data clusteringIn:Procof ACM 10th Int lConfInformation and Knowledge

24、Management(CIKM 2001), Atlanta, 2001254 318Dhilion I S. Co-clustering documents and words using Bipartite Spectra1 Graph PartitioningKDD 2001 San Francisco. California, USA9Ding H Q. Unsupervised feature selection via two-way ordering in gene expression analysishttp:/bioinformatics.oupJoumalsorg/cgi

25、/reprint/19/10/125910Cu M, Zha H, Ding C, He X, Simon H, Xia J. Spectra1 relaxation models and structure analysis for Kwhy graph clustering and bi-clustering http:/ citeseer.st.psu.edu/context/2380189/63939411Dhillon I, Guan Y, Kulis R. A Unified View of Kernel k means, Spectra1Clustering and Graph

26、Cuts. In ICPR02. 2002 28929212Damnjanovic Uros , Izquierdo Ebroul. Asymmetric and Normalized Cuts for Image Clustering and Segmentation. Neural Network Applications in Electrical Engin eeri ng. Sept. 2006: 5913OCallaghan, R.J. Bull, D.R. Combined morphological-spectral unsupervised image segmentatio

27、n. Image Processing, IEEE Transactions on Volume 14, Issue 1, Jan. 2005 Page(s):49 - 6214Alzate, C. Suykens, J.A.K. Image Segmentation using a Weighted Kernel PCAApproach to Spectral Clustering. Computational Intelligence in Image and Signal Processing. April 2007: 208 - 21315司文武 ,钱法涛 . 一种基于谱聚类的半监督聚类方法 . 计算机应用 . 25(6),2005.7: 1347-134916Kamvar S D, Klein D, Manning C D. Spectra1 Learning CAI-03 ,200517李小斌,田铮.基于谱聚类的图像多尺度随机树分割.中国科学E辑:信息科学. 37 (8), 2007: 10731085

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1