遥感图像分层空间相似度的半监督分类概要Word格式.docx
《遥感图像分层空间相似度的半监督分类概要Word格式.docx》由会员分享,可在线阅读,更多相关《遥感图像分层空间相似度的半监督分类概要Word格式.docx(12页珍藏版)》请在冰豆网上搜索。
在L.Gó
mez-Chova[6]等的文献中,支持向量机的决策函数被拉普拉斯曲线的局部一致性编码修改,因此使得特征空间的邻域有相似的决策函数值。
最近的研究提出通过改变先前的内核,使支持向量机最佳化。
这看起来是通过未标记的样本来编码信息的一个简便方法,因为不需要修正分类器,并且所有未标记样本的信息都包含在核心矩阵里。
在J.Weston[7]等的文章里,作者提出了用聚集的方法建立一个非监督的松弛的内核,用构成集群成员所选择的样本来进行相似度评估。
TuiaandGamps-Valls[1]再次利用了这一影像分类方法,随后提出了松弛内核不同层次的版本[8]。
在以上所有的研究中,都建立了基于未标记样本的内核,并且将标准支持向量机内核和内核构成结合起来[9],[10]。
尽管这些方法应用简单、效果很好,但是这些方法很少考虑遥感影像的空间特征。
由于遥感图像的地物都是地理空间的,所以遥感图像都是空间连续的,观察的地物都是空间平滑的。
如果一个像素属于一种地物类别,比如农作物用地,那么该像素空间邻近的像素也很有可能是农作物用地。
跟SSL方法里假设一个群类似(相同类别的像素属于空间上相同的群[2]),我们可以将这种假设用在空间上的族假设上。
在M.Marconcini[11]等的文章里,作者用改进的半监督法分类器总结空间信息,但是实验仅针对单一的种类和一个尺度的空间分类器,然而样地物都是高分辨率并且是不同尺度的。
在L.Capobianco[12]的文章里,作者提出了从空间邻近的未标记的样本中来分类的方法。
另外一种可能是通过图像分割来实现空间平滑。
在J.Li[13]等的文章中,用半监督学习法分割的方法马尔科夫随机场来建立空间信息模型。
在L.Bruzzone和L.Carlin[14]的文章中,作者用分层分割的方法来提取特征和特征矢量,然后在增强的空间来训练支持向量机。
在J.Muñ
oz-Marí
[15]等人的文章中,利用有限的标记像素和分层分割结果,通过交互式学习的方法来找到最佳的分割尺度。
在本文中,我们利用分层分割将相似的像素组合为一个新的尺度,用核心分类器提高分类的质量。
我们提出了一个半监督学习的支持向量机内核的空间一致性假设。
空间一致性是通过对影像多尺度分割结果的相似估计得到的,我们将数据变成分层描述的。
为了建立空间内核我们提出了两种距离尺度,比如在第一层上两个像素属于同一群,并且相似度是用在分割的层上的聚合距离(aggregationdistance,AD)来度量的。
最后的内核将空间内核和松弛内核线性结合起来组成的,如D.Tuia[1]文章里所提到的。
本文提出的方法实现了不完全基于样本的预测并且将复杂等价的训练成传统的支持向量机,只是增加了分割的代价。
本文主要贡献是:
1)用多尺度分割方法对遥感图像建立空间一致性模型,以便更好的利用SSL方法分类;
2)在多尺度分割的基础上采用了两种距离估计方法来决定空间内核。
本文结构大致如下:
第二部分介绍提出的SSL方法;
第三部分介绍利用的数据集和实验步骤;
第四部分报告和分析实验结果;
第五部分总结本文。
2.算法原理
已经提出的运算法则是标准支持向量机(supportvectormachine,SVM)和变形的内核。
这个变形是根据设计核心函数的需要来调整的,用一种精确的方式代表了样本之间的相似性:
以下的半监督学习方法中的聚类假设,我们需要在光谱和空间上增加属于同一个群的像素之间的相似度。
假设光谱连续,一种增强聚类假设的方法是设计一个松弛的内核(或者聚类的核心[7]),将传统的基于半径的函数(traditionalradialbasisfunction,RBF)核心KRBF变形为两个未标记的样本的内核的关系KBAG,如下所示:
∈(0,1)
(1)
T是完成聚拢算法的数量,
是像素
在t次方时的聚拢成员,并且当样本xi和xj在同样的t下属于同一个群时,式子
返回1,否则返回0。
式子
(1)返回的结果是一个有效的内核[7]。
本文提出的内核是加上第三个项来扩展这个公式,增加了通过多尺度分割得到的空间平滑区域的相似性。
在整个图像上运行了多尺度分割法则后(运用所有未标记的样本和可利用的标记样本),一个新的内核空间一致性被建立KSEG,并且由先前的KRBF和KBAG组成线性组合关系。
最后的内核K如下所示:
(2)
这个运算法则计算的代价是以下几项的和:
1)多尺度分割运算(运算一次);
2)聚集运算的代价(本例中,T运行k此,O(mdk));
3)标准支持向量机花费O(n2d)。
算法1总结了提出的方法。
本文接下来的部分将详细描述内核的空间一致性KSEG。
2.1空间内核的构造
用
表示像素xi属于分割层(Hierarchicallevel,HL)h的分割。
分割层是通过对整个图像进行分割运算得到的,h=1表示分割体系中最优的分割层。
对一个确定的分割层H,每个像素xi都能用一个分类区域表示
。
相似度的一个空间测量可以用以下方式定义:
对于两个像素xi和xj,空间相似度可以通过它们属于的第一个相同的分割层来度量。
如果这个分割层在分割体系中是处于底层的,那么这两个像素就被认为是相似的。
空间核心构造的一个插图如图2.1所示。
图2.1空间核心构造图解,以及图像分割后的图像分层描述。
黄色的结点和红色的结点是第三层第一个被合并为同一个块的。
因此,通过分割层距离和公式(3)取
,那么两个样本的相似度就是0.73,比这些像素属于其他物体的时候的相似度值要高,如蓝绿色和绿色结点。
我们提出了两种距离测度方法来评估像素之间的相似度,例如分割层距离
HL和给定聚合层的聚合距离AD。
HL距离可以定义为dHL(xi,xj)=argmin{
=
}。
换句话说,符合最小层的聚合,那么像素就属于同一个分割;
如果两个像素在最小层属于同一个物体(
),就设定dHL(xi,xj)=1。
AD被定义为和分层分割距离HLh相当的距离(例如,取HLh中两个分割层距离的平均作为距离值):
在上述dHL(xi,xj)=1的情况下dAD(xi,xj)=0。
这两种距离度量方式有不同的取值范围和不同的意义(例如,如果我们有300个不同的分割层,HL取值范围是从1~300,而AD在光谱角填图是从0~1取值的),HL是线性聚合方式(例如,HL中每个聚合产生的增加是一样的,如图2.1)。
而AD是依照不同分割之间相似度阶跃的方式聚合的(例如,第一次聚合是在较小的AD下进行,最后是聚合不相似的分割层)。
在两种方式中,最后的内核K在距离d上单调递减的函数(可以是dHL或者dAD中的任意一个),调优参数a>
(3)
参数a控制了相似函数的相似程度的比率:
a的值越高,当d(xi,xj)增加时,相似度呈指数增加得越快。
3.数据集和实验设计
3.1使用的数据集
帕威亚数据集(PaviaDataset):
使用从反射光学高光谱成像光谱仪的机载数据(ROSIS-3)。
这些影像显示的是意大利北端的一个城市帕威亚的数据。
因为噪声影响,只有103个普段被真正利用。
这个图像大小是610×
340像素,空间分辨率是1.3米。
在由42776个标记像素组成的真实地面上定义了九类感兴趣的地物。
如图4.3。
里约数据集(RioDataset):
在这个试验中,需要用到传感器WorldView-II得到的高分辨率多光谱数据。
这幅影像覆盖了巴西的里约热内卢中心的一部分[16]。
在空间分辨率为2米的数据集中应用了八个不同光谱段的数据。
原始最低点图像301×
301的子集被用在了本实验。
考虑了五类地物,为了判读总共提取了15294个标记像素。
数据如图3.1所示。
图3.1里约数据集。
(a)三波段合成影像(bands4,3,和2)(b)该地区实际地面情况(包括水、树、草、路和建筑)
3.2实验设计
分割算法:
为了将影像分割为不同的层次和区域,采用多尺度分割的方法[17]。
这个算法一开始将每个像素都当成一个分割的块。
多尺度分割算法通过不断的迭代来分割影像,将最小相异性的分割块合并起来(一般是分割块的中心之间的欧式距离或者余弦距离),直到整个影像都被当做一个分割块。
下文一个重要的参数是chk_nregions参数,通过返回函数返回的分割层信息控制了最精细层的区间的数量(当h=1时)。
分类器和自由参数:
本文实验采用了一对多的支持向量机。
我们采用RBF内核当作光谱的内核,因为它输出的相似度是正值,并且在范围[0,1]内,因此容易和其他的内核结合,而不用将其值标准化。
支持向量机参数C和
通过在同样的范围内交叉验证来调整{10-3,…103}。
在本实验中,
=1000没有标记的像素被随机选取,用来组成KBAG,像在[1]里一样。
在k均值算法中用来建立KBAG的群的数量K为30。
在实验分析的基础上,协调参数a根据经验在HL距离中定为1,在AD方法中定为50。
接下来对不同大小的标记集进行敏感度测试,光谱内核的权重KRBF和松弛内核KBAG根据经验定为
和
对各个参数敏感度测试的结果展示在4.2中。
多尺度分割函数的hk_nregions被定为1024。
hk_nregions的敏感度测试结果在4.3中。
结果评定:
分类精确度用总体精度(OA,[%])和Kappa系数k来评估。
为了测试所提到的方法,对每个类用n={10,…,80}个Pavia数据集里随意选取的标记样本,和n={5,…,40}个Rio数据集里随意选取的标记样本。
对每个大小相同的组,随意选择10个训练数据集。
求出这10个选择的训练集的评价Kappa值。
我们把用标准径向函数支持向量机、松弛向量机[1]、多量程版本的松弛向量机[8]、空间光谱复合内核[9](包括了空间平均滤波器来调整空间),这些不同方法组成的核函数的结果进行对比。
最后我们根据不同层的空间特征来增强RBF内核KRBF,同时展示了两种方法的互补性。
4.结果和分析
4.1数值结果
对于Pavia数据集(见图4.1),利用本文提出的方法使松弛支持向量机的Kappa系数显著增强了10%-15%。
对于空间内核,使用HL距离比使用AD距离的效果要好得多。
另外,本文提出的方法比利用复合内核的方法要好得多。
在所有的情况下,通过McNemar的测试证明这个增加是很重要的。
HL距离的有点如下:
用HL距离,每个聚合层阶跃和距离的增加是一样的,对于分开来自不同类但空间相近的易混淆像素有很大帮助,并且展示了相似的光谱特性。
而AD距离对于这些像素会返回一个高KSEG值,而对于小的聚合层的返回值会比较小。
相反,HL距离增加了在低层级的聚合像素之间的不相似度。
当考虑到由KRBF[14]构造的多尺度分类的空间特征时,支持向量机的基线(看图4.1(b)的蓝色虚线)提高了20%,本文提出的方法在光谱情况下也有相似的结果(见图4.1(a)的红线)。
然而,当KRBF和KSEG线性组合时(见图4.1(a)的红线),对结果有额外的促进[14],包含在12%(每个类10个标记的像素)到3%(没各类80个标记的像素)之间。
对于Rio数据集(见图4.2),利用可用的标记信息,松弛支持向量机的Kappa系数增加了2%-7%。
对于这个数据集,复杂性越小,结果增加的越小,有一个较低的尺寸(d=8,Pavia数据集里d=103)和较小的类别数(5个,Pavia数据集里9个)。
并且,两个空间内核的分类结果相似,但仍然优于复合的方法。
图4.1本文所提方法针对Pavia数据集的分类精确度
(a)KRBF使用光谱波段(b)利用组合尺度的有上下文关系的特征,如[14]里提到的。
松弛支持向量机是[1]里的方法,组合尺度的松弛支持向量机是[8]的方法,复合内核是[9]里的方法。
图4.2本文所提方法针对Rio数据集的分类精确度
针对Pavia数据使用不同方法得到的分类图如图4.3所示。
用前三种方法分类时,得到的分类图中很多草地区域(绿色)被误分为裸地,特别是图像较低的部分。
而用本文所提的方法,大多数的区域都被正确的分类,特别是基于HL距离的方法。
并且,本文所提的方法比其他的复合方法提供了更多连贯的分类图。
特别是对于“裸地”类(图像中央部分),用其他分类方法得到的图像中,裸地会被误分为草地。
图4.3针对Pavia数据集的复合方法和本文提出方法的分类图
(a)真实地面信息(b)标准支持向量机方法(c)松弛支持向量机方法[1]
(d)复合内核[9](e)本文提出方法(HL)(f)本文提出方法(AD
4.2内核权重的敏感度分析
图4.4OA[%]对Pavia数据集内不同的内核权重
(a)每个类别10个训练样本(b)每个类别80个训练样本
图4.4显示了在组合内核中用不同的权重
得到的结果:
图4.4(a)显示了用有限数量的训练样本得到的OA值(每个类别10个样本),图4.4(b)显示了用更多训练数据得到的结果(每个类别80个样本)。
在两种情况下,对角线元素的精度低于非对角线元素。
(需要注意的是,三角形的上半部分是空的,因为没有考虑
的情况)。
这条对角线对应情况
,这意味着内核空间没有使用组合
(2)。
它也对应着[1]里的松弛支持向量机。
这更加证明增加相似度的方法取决于空间信息提出。
如在[10]里发现的一样,最好的组合是运用所有的内核,因为它们在分类问题上有不同的编码视角:
光谱相似性KRBF,流形(manifold)的结构,和空间分布KSEG。
一个单独的资源可能得到次优的结果:
如果只用KSEG(当
)这个相似度就成了在空间上分开训练样本的函数。
如果这些样本分布的不一致,那么结果的精度就主要取决于这些样本的临近程度(利用Pavia数据的实验中,只用KSEG,最后OA的结果是62.6%
7.4(当n=40的时候)和68.6%
3.04(当n=80的时候))。
而本文提出的空间光谱模型的精度在两种情况下都高于80%。
与在[8]里的相似,当只有少量的标记样本时,KSEG的权重是决定分类结果精度很重要的因素。
当有更多的标记样本的时候,空间内核的影响力会降低。
由于在标记像素不充足的情况下,支持向量机很难找到正确的调整层,这个困难可以部分被KBAG解决(如图4.4所示),而KSEG可以进行更深层的空间调整。
4.3不同程度空间调整的结果
通过改变多尺度分割的深度来测试不同程度空间调整的影响。
在多尺度分割函数里选择不同的chk_nregions,我们得到了一系列分层体系的结果,在最好的尺度有不同数量的区域(h=1),如图4.5中的(b)所示。
分类结果所用的空间内核
是由HL距离衍生出来的,如图4.5中的(a)所示。
图4.5(a)Pavia数据集中提出的方法得到的结果的Kappa系数(用不同的多尺度分割函数)chk_nregions是在最低层聚集的分割块的数量,它分别取200和800的结果如(b)所示。
在图4.5中,我们可以看到,用数量非常有限的训练集(每个类别10和20个样本),用更强的空间调整(200和400段)比用较弱的空间调整(600和800段)效果好。
这验证了前一部分的观察值,当考虑用有限的样本得到的错误的训练分类器的时候,可以合理推断出强的调整值可以提高分类的结果。
当训练样本的数量增加的时候,空间调整的必要性就会降低。
5.总结
本文提出了一个用两个物体间内核编码空间关系来进行遥感影像半监督分类的方法。
空间内核是由多尺度分割中提取的距离来建立的。
这个内核同时利用像素层和分割层的相似度,因此强调了空间独立群的假设。
实验结果证明,本文提出的方法包含空间相似度,有更高的分类精度并且分类图更加平滑,比基于光谱的分类器和基于复合内核,考虑空间滤波的空间光谱的方法效果好。
6.致谢
感谢Pavia大学提供Pavia数据集,感谢DigitalGlobe和IEEE图像分析和数据融合技术委员会把Rio数据集变得可用。
同时感谢三位评审的宝贵意见。
参考文献
[1]D.TuiaandG.Gamps-Valls,“Semisupervisedremotesensingimageclassificationwithclusterkernels,”IEEEGeosci.RemoteSens.Lett.,vol.6,no.2,pp.224–228,Apr.2009.
[2]O.Chapelle,B.Schö
lkopf,andA.Zien,Semi-SupervisedLearning,1sted.Cambridge,MA,USA:
MITPress,2006.
[3]Q.JacksonandD.A.Landgrebe,“Anadaptiveclassifierdesignforhighdimensionaldataanalysiswithalimitedtrainingdataset,”IEEETrans.Geosci.RemoteSens.,vol.39,no.12,pp.2664–2679,Dec.2001.
[4]L.Bruzzone,M.Chi,andM.Marconcini,“AnoveltransductiveSVMforthesemisupervisedclassificationofremote-sensingimages,”IEEETrans.Geosci.RemoteSens.,vol.44,no.11,pp.3363–3373,Nov.2006.
[5]G.Gamps-Valls,T.V.B.Marsheva,andD.Zhou,“Semi-supervisedgraph-basedhyperspectralimageclassification,”IEEETrans.Geosci.RemoteSens.,vol.45,no.10,pp.3044–3054,Oct.2007.
[6]L.Gó
mez-Chova,G.Gamps-Valls,J.Muñ
andJ.Calpe-Maravilla,“SemisupervisedimageclassificationwithLaplaciansupportvectormachines,”IEEEGeosci.RemoteSens.Lett.,vol.5,no.3,pp.336–340,Jul.2008.
[7]J.Westonetal.,“Semisupervisedproteinclassificationusingclusterkernels,”Bioinformatics,vol.21,no.15,pp.3241–3247,Aug.2005.
[8]D.TuiaandG.Gamps-Valls,“Urbanimageclassificationwithsemisupervisedmultiscaleclusterkernel,”IEEEJ.Sel.TopicsAppl.EarthObserv.RemoteSens.,vol.4,no.1,pp.65–74,Mar.2011.
[9]G.Camps-Valls,L.Gó
mez-Chova,J.Mu-oz-Marí
J.Vila-Francé
s,andJ.Calpe-Maravilla,“Compositekernelsforhyperspectralimageclassification,”IEEEGeosci.RemoteSens.Lett.,vol.3,no.1,pp.93–97,Jan.2006.
[10]D.Tuia,F.Ratle,A.Pozdnoukhov,andG.Camps-Valls,“Multi-sourcecompositekernelsforurbanimageclassification,”IEEEGeosci.RemoteSens.Lett.,vol.7,no.1,pp.88–92,Jan.2010.
[11]M.Marconcini,G.Gamps-Valls,andL.Bruzzone,“AcompositesemisupervisedSVMforclassificationofhyperspectralimages,”IEEEGeosci.RemoteSens.Lett.,vol.6,no.2,pp.234–238,Apr.2009.
[12]L.Capobianco,A.Garzelli,andG.Camps-Valls,“Targetdetectionwithsemisupervisedkernelorthogonalsubspaceprojection,”IEEETrans.Geosci.RemoteSens.,vol.47,no.11,pp.3822–3833,Nov.2009.
[13]J.Li,J.M.Bioucas-Dias,andA.Plaza,“Semisupervisedhyperspectralimagesegmentationusingmultinomiallogisticregression