谱聚类算法及其在图像分割中的应用.docx

资源描述

谱聚类算法及其在图像分割中的应用.docx

《谱聚类算法及其在图像分割中的应用.docx》由会员分享，可在线阅读，更多相关《谱聚类算法及其在图像分割中的应用.docx（10页珍藏版）》请在冰豆网上搜索。

谱聚类算法及其在图像分割中的应用.docx

谱聚类算法及其在图像分割中的应用

1引言

在对图像的研究和应用中，人们往往仅对图像中的某些部分或者说某些区域感兴趣。

这些部分常称为目标或前景（其他部分称为背景），它们一般对应图像中特定的具有独特性质的区域。

为了辨识和分析目标，需要将它们从图像中分离提取出来，在此基础上才有可能对目标进一步利用。

图像分割就是指把图像分成各具特性的区域并提取出感兴趣目标的技术和过程。

这里的特性可以是像素的灰度、颜色和纹理等，预先定义的目标可以对应单个区域，也可以对应多个区域。

多年来，对图像分割的研究一直是图像技术研究中的热点和焦点，它不但是从图像处理到图像分析的关键步骤[1]，而且是计算机视觉领域低层次视觉中的主要问题。

图像分割的结果是图像特征提取和识别等图像理解的基础，只有在图像被分割后，图像的分析才成为可能。

图像分割在实际应用中已得到了广泛的应用，如图像编码、模式识别、位移估计、目标跟踪、大气图像、军用图像、遥感图像、生物医学图像分析等领域。

同时，图像分割也在计算机视觉和图像识别的各种应用系统中占有相当重要的地位，它是研制和开发计算机视觉系统、字符识别和目标自动获取等图像识别和理解系统首先要解决的问题。

概括地说只要需对图像目标进行提取测量等都离不开图像分割。

对分割算法的研究已经有几十年的历史，至今借助于各种理论已经提出了数以千计的分割算法[2]，而且这方面的研究仍然在积极进行。

尽管人们在图像分割方面做了许多工作，但至今仍无通用的分割算法，也不存在一个判断分割是否成功的客观标准。

因此已经提出的分割算法大都是针对具体问题的，并没有一种适合于所有图像的通用的分割算法。

实际上由于不同领域的图像千差万别，也不可能存在万能的通用算法。

现有的分割算法非常多，大体上可以分为以下几类：

阈值化分割、基于边缘检测的、基于区域的、基于聚类的和基于一些特定理论工具的分割方法。

从图像的类型来分最常见的：

有灰度图像分割、彩色图像分割和纹理图像分割等等。

本文所要介绍的基于谱聚类的图像分割，是基于聚类分析方法中的一种。

传统的聚类算法是建立在凸球形的样本空间上，当样本空间不为凸时，算法会陷入“局部”最优。

相对于这些传统算法，谱聚类能在任意形状的样本空间上聚类，且收敛于全局最优解。

2谱聚类算法的基本原理

聚类分析是模式分类中的经典问题。

它是通过抽取数据的“潜在”结构，将相似数据组成类或类的层次结构。

它不需要先验知识和假设，故它也称作是无监督学习。

传统的聚类算法主要是k-means算法和EM算法。

这些算法都是建立在凸球形的样本空间上。

当样本空间不为凸时，算法会陷入“局部”最优。

为了能在任意形状的样本空间上聚类，且收敛于全局最优解，研究学者最近开始利用谱方法来聚类。

谱方法聚类是由数据点间相似关系建立矩阵，获取该矩阵的前n个特征向量，并且用它们来聚类不同的数据点。

谱聚类方法建立在图论中的谱图理论上。

最初，它是用于负载均衡和并行计算，VLSI等方面，如Hagen和Kahng[3]将基于ratio-cut的目标函数图划分算法用于VLSI设计中。

最近，学者们也开始将谱聚类方法用于机器学习中。

Shi和Malik⑷在2000年根据谱图理

论建立了2-way划分的Normalized-Cut（Ncut）的目标函数，设计了用于图像分割的算法，由此发展出一系列算法：

k-way划分的Ncut算法（Ng和WeissL[5]）；NormalizedCut与随机游动关系的算法（Meila和sh料）；基于二分图的算法（Zha⑺和Dhillon[8]）等。

并且，谱聚类方法的应用也开始从图像分割领域扩展到文本挖掘（DhillonE⑹）和生物信息挖掘领域（ChrisDing[9]）等领域中。

2．1图划分问题与聚类

聚类算法的一般原则是类内样本间的相似度大，类间样本间的相似度小。

假定将每个数据样本看作图中的顶点y，根据样本问的相似度将顶点间的边赋权重值，就得到一个基于样本相似度的无向加权图：

G（V，E）。

那么在图G中，我们

可将聚类问题转变为如何在图G上的图划分问题。

划分的原则是：

子图内的连权重最大化和各子图间的边权重最小化。

针对这个问题，Shi和MalikEz提出了基于将图划分为两个子图的

2-way目

标函数Ncut:

.KTzA»cui（AiB）jminNc«r（AtB）=如⑷+右⑻-

（1）

vol（A）=S

（2）

FEAi〜j

cui（A,B）=S

（3）

其中cut（A,B）是子图A,B间的边，又叫“边切集”。

从式

（1）,我们可以看出改进后目标函数不仅满足类间样本间的相似度小，

也满足类内样本间的相似度大。

assoCA）=SSWy=vol（A）—cut（A9B）（4〉

minNc说（A，B）=min（2—签牆十啜醤）⑸

如果考虑同时划分几个子图的话，则基于k-way的Normalized-cut目标函数为：

NcugM）=郛空驾+…+黔％辔⑹

除了Ncut目标函数外，还有Hagen和Kahng提出的Ratio-Cut和Ding等提

出的Min-MaxCut。

三个目标函数中，Ratio-Cut只考虑类间相似性最小，且最易产生“倾斜”的划分。

而Min-MaxCut与Ncut—样满足类内样本问的相似度大而类间样本的相似度小的原则，与Ncut具有相似的行为。

2.2谱图理论

谱图理论是一个具有很长历史的理论。

它是利用矩阵理论和线性代数理论来研究图的邻接矩阵，根据矩阵的谱来确定图的某些性质。

谱图理论分析的基础是图的Laplacian矩阵，它是Fiedler[11]1973提出来的。

假设一无向加权图G=,其表示形式为一对称矩阵：

W=[Wij]n*n，其

中Wij表示连接顶点i与j的权值。

那么该图的Laplacian矩阵表示为：

L=D-W

其中，D为对角阵。

Laplacian矩阵是对称半正定矩阵，因此它的所有特征值是实数且是非负的：

0=九＜=如＜=■・、＜=入井

如果G是c个连接部件，那么L有c个等于0的特征向量。

如果G是连通的，第二个最小特征值不为0,则它是G的连接代数值（Fiedter-value）。

其对应的特征向量为Fiedler向量。

当我们考虑2-way划分时，令P是A的划分指示向量:

Pi=

那么：

CutCAfAe）=/）—cut（AfAc）=/（/>）=-r-S

Wg（A—/>p2—2

考虑到约束'，则

minNcut（>1,Ac）=minT（9）

将X放松（松弛）到连续域［-1,1］，获得minNCut的问题就是:

根据瑞利商原理，式（10）的优化问题等于下列等式的第二最小特征值的求解

问题：

D叫（D—W）d7戈=4（11）

对应于第二最小特征值对应的特征向量X2则包含了图的划分信息。

人们可

以根据启发式规则在X2寻找划分点i,使得值大于等于X2i的划为一类，而小于X2i的划为一类。

同理，我们可以推理得到k-wayNcut目标函数式（6）的最优解在式（11）的是个最小特征值对应的特征向量所组成的子空间上。

2．3算法描述

谱聚类算法由三个部分组成：

1．建立表示样本集的矩阵S。

2•计算S的k个特征值与特征向量

a.2-way:

将原始样本数据映射到一维空间（k=1）;

b.k-way;将原始样本数据映射到由k个正交向量组成的k维空间S'

3.将k维子空间S'的行作为样本的新的数据表示，且基于这种新的表示，将样本进行聚类。

a.2-way:

在一维空间上根据目标函数最优原则划分，并且在划分好的两个子图上迭代划分;

b.k-way:

利用传统的k-means或其它传统聚类算法在是维空间上进行聚类。

上述的描述是算法的一个框架，在具体的算法中，不同的算法在数据集矩阵

S的表示上存在着不同，女口：

根据2-wayNcut的目标函数，S=D-1/2LD-1/2;根据随机游动关系，S=D-1W等。

3谱聚类算法在图像分割中的应用

谱聚类方法最初是在图像分割中应用shi和Malik⑷将像素作为顶点，根据像素的亮度和空间位置确定连接像素点问边的权值，利用2-wayNcut的谱聚类方法迭代地进行图的分割。

该方法获得了满意的效果。

M.Gu,H.Zha等人［10］分析了在不规则图上进行k-way图划分的谱松散模型，并且根据该模型，提出了k-wayNcut与k-wayMin-Maxcut不同目标函数设置的下限值，同时分析了对应于最优解的特征空间或单个特征向量的代数结构，为将谱图理论运用到k-way图划分问题中，提供了理论基础。

Meila和shi⑹将相似性解释为Markov链中的随机游动，分析了这种随机游动的概率转移矩阵P=D-1W的特征向量（其中：

W是相似度矩阵），并且根据随机游动对Ncut进行了概率的解释，提出了基于随机游动的新的算法。

同时，在这

个解释框架下提出了多个特征相似矩阵组合下的谱聚类方法，在图像分割中也取得了很好的效果。

Zhd7］等人和Dhillon⑺研究了基于二分图G=上的谱聚类。

聚类目标是使得在最小化二分图上的不匹配顶点对间的边权重和最小，故目标函数可以用变形的Ncut表示；

滋的严皿）語融丽讦羽罰（12）将二分图的邻接矩阵W转换对称矩阵：

4「°叮

LW0」

然后再根据谱图理论对二分图上划分的目标函数式（12）进行分析（与2的分

析相似）。

Zha等人与Dhilion发现最小化目标函数式（12）可以等同于与二分图相关联的边权重矩阵的奇异值分解。

Dhillonc将其运用到文档聚类中，对CMU的

Newsgroup20做了实验，取得了很好的效果。

基于二分图模型，该算法同样也可以用于市场分析中交易-商品的分析，生物信息挖掘中的Geneexpressionprofiles

Zha等人分析了核k-means的方法，发现最小化核k-means的目标函数等同于一个由数据向量组成的Gram矩阵的迹最大化问题。

同时，迹最大化问题的松散解可以通过Gram矩阵的部分特征分解获得。

首次用谱松散的方法获得核k-means的目标函数的全局最优解。

Dhillon［11］在此基础上，又研究了加权核

k-means的目标函数，将其与Ncut目标函数建立联系，提出了一个可以单调递减Ncut值的新颖的加权核k-means算法。

Ncut是一个可行的聚类目标函数。

它的求解是一个NP难问题。

传统的方法是宽松的谱松散方法。

Xing与Jordan则分析了对Ncut的半正定规划（SDP）模型。

根据该模型，对Ncut提出了一个比谱松散更紧的下限。

同时指出Ncut本身不能刻画最优的聚类，但它可以通过不同的松散方法获得合理的聚类。

图一所示为一种基于PCA加权的Ncut图像分割结果：

a.原始图像b.子采样后训练图像

e.前景图像f.Pepper图像细节

图一.基于Ncut的Pepper”图像分割结果

由于Ncut算法计算量比较大（为0（n3）），尤其在图像的数据量大时更为明显。

UrosDamnjanovic和Ebroullzquierdo［11］提出了Acut算法，该算法是Ncut图像分

割算法的一种简化处理。

Acut算法只对感兴趣的区域进行处理，仅需要一步就

能够提取出图像信息。

通过利用两个像素之间和与其相邻像素的相关性来构造这

像分割结果如图二所示

（d）

图二.Acut图像分割结果

谱聚类方法不仅用于无监督学习中［13］，也用于有约束的半监督学习中［15］。

Kamva』6］等人将PageRank的随机游动模型运用到相似度矩阵中，根据已知样本

的类别修正相似度矩阵。

然后根据谱聚类算法获得聚类结果。

Bach与Jordan则

是根据一个基于已知的划分与Ncut谱松散结果的误差，提出了新的目标函数。

通过最小化新的目标函数推出新的谱聚类算法，获得聚类结果。

田铮和李小斌［17］针对谱聚类应用于图像分割时权矩阵的谱难以计算的实际问题，定义了像素点与类之间的距离，给出一个采样数定理，设计了一个图像的分层分割（hierarchicaldivisive）算法.在利用该算法进行图像分割时，由于既要对待分类的点进行随机抽样，又要通过调节尺度因子来合并较小的类或拆分较大的类，因此图像的分割既具有随机性又具有多尺度特性，称之为基于谱聚类的图像多尺度随机树分害U（multiscalestochastichierarchicalimagesegmentationbyspectralclustering,简写为MSHISSC）.

图三.基于MSHISSC与基于Normalizedcut和Min-maxcut

的图像分割算法的比较结果

其中第1列是原始图像,第2列是利用MSHISSC得到的分割结果,第3列是利用Normalizedcut到的分割结果，第4列是利用Min-maxcut得到的分割结果。

4谱聚类算法中的关键问题和未来的研究方向

尽管谱聚类算法具有坚实的理论基础一一谱图理论，并且在实践中也取得了很好的效果，但是它仍然存在一些关键问题：

1•如何构造邻接矩阵w；在谱聚类算法中，边的权值是顶点i与j的相似度sim（i,j）,故表示图的邻接矩阵也是样本空间的相似度矩阵。

相似度矩阵的构造依

赖于两个样本间相似度的构造。

而单纯地依赖人为选择的相似度函数是带有一定的局限性的。

我们应该引入相关领域知识，学习构造邻接矩阵。

2．自动地确定聚类的数目：

聚类数目的确定对聚类的质量有很大的影响。

当聚类数目大于实际聚类数，k-way谱聚类方法的效果差。

因此如何自动地确定聚类数目是一个关键的问题，是未来研究的方向。

3．如何解决模糊聚类的问题：

尽管在文档聚类中，谱聚类取得了很好的效果。

但是在文档聚类中，单个词可能属于多个类，单个文档可能是多主题的文档。

这就需要我们用模糊聚类的方法解决。

如何确定基于模糊聚类与谱方法的联合：

如建立模糊标准的图划分的目标函数等，是我们的研究方向。

4．运用到海量数据中去：

当我们用谱聚类，不可避免地要计算矩阵的特征值与特征向量。

通常这种计算的代价很大，求解非稀疏矩阵的所有特征向量的标准解法需要0（n3）。

同时当应用到海量数据时，相似度矩阵也很大，可能会超出计算机的内存。

DhillonE在研究了谱聚类和核k-means聚类方法的关系后，将谱聚类问题用核k-means算法求解，并且运用到核k-means算法的优化技巧，来解决海量数据的计算。

但该方法只用于非二分图的谱聚类方法，对二分图的聚类问题仍然是我们未来的研究方向。

参考文献

[1]章毓晋.图像分割.北京:

科学出版社,2001

[2]ZhangYJ.ASurveyonEvaluationMethodsforImageSegmentation.Pattern

Recognition,1996,29（8）:

1335~1346

[3]HagenL,KahngAB.Newspectra1methodsforratiocutpartitioningand

clustering.IEEETrans.Computer-AidedDesign,1992,11（9）:

10741085

[4]ShiJ,MalikJ．Normalizedcutsandimagesegmentatio．nIEEETransactionsonPatternAnalysisandMachineIntelligence，2000,22（8）：

8884905

[5]NgA，JordanM，WeissY．Onspectralclustering：

Analysisandanalgorithm,AdvancesinNeuralInformationProcessingSystems1．4MITPress，2001

[6]MeilaM，ShiJ．Arandomwalksviewofspectra1segmentation．In:

8thInternationalWorkshoponArtificia1IntelligenceandStatistics，2001

[7]ZhaH,HeX．DingC，GuM,SimonHD.BipartiteGraphPartitioningandDataclustering．In：

Proc．ofACM10thInt'lConf．InformationandKnowledgeManagement（CIKM2001），Atlanta，2001．25431

[8]DhilionIS.Co-clusteringdocumentsandwordsusingBipartiteSpectra1GraphPartitioning．KDD2001SanFrancisco.California,USA

[9]DingHQ.Unsupervisedfeatureselectionviatwo-wayorderingingeneexpressionanalysis．http:

//bioinformatics.oupJoumals．org/cgi/reprint/19/10/1259

[10]CuM,ZhaH,DingC,HeX,SimonH,XiaJ.Spectra1relaxationmodelsandstructureanalysisforK—whygraphclusteringandbi-clustering．http:

//citeseer.st.psu.edu/context/2380189/639394

[11]DhillonI,GuanY,KulisR.AUnifiedViewofKernelkmeans,Spectra1

ClusteringandGraphCuts.InICPR02.2002289〜292

[12]DamnjanovicUros,IzquierdoEbroul.AsymmetricandNormalizedCutsforImageClusteringandSegmentation.NeuralNetworkApplicationsinElectricalEngineering.Sept.2006:

5—9

[13]O'Callaghan,R.J.Bull,D.R.Combinedmorphological-spectralunsupervisedimagesegmentation.ImageProcessing,IEEETransactionsonVolume14,Issue1,Jan.2005Page（s）:

49-62

[14]Alzate,C.Suykens,J.A.K.ImageSegmentationusingaWeightedKernelPCA

ApproachtoSpectralClustering.ComputationalIntelligenceinImageandSignalProcessing.April2007:

208-213

[15]司文武,钱法涛.一种基于谱聚类的半监督聚类方法.计算机应用.25（6）,

2005.7:

1347-1349

[16]KamvarSD,KleinD,ManningCD.Spectra1Learning．CAI-03，2005

[17]李小斌，田铮.基于谱聚类的图像多尺度随机树分割.中国科学E辑：

信息

科学.37（8）,2007:

1073~1085

展开阅读全文