遥感图像质量检测综述.docx
《遥感图像质量检测综述.docx》由会员分享,可在线阅读,更多相关《遥感图像质量检测综述.docx(11页珍藏版)》请在冰豆网上搜索。
遥感图像质量检测综述
遥感图像质量检测综述
摘要:
质量检测是遥感图像信息可用性的重要保证,且贯穿于遥感数据应用的整个阶段。
本文主要针对遥感图像的处理流程中的原始图像接收、图像预处理、图像信息提取三个阶段进行质量检测的研究。
同时具体分析了最后一阶段质量检测中常用的四种检测方法,为后续的研究奠定基础。
关键词:
遥感;处理流程;不确定性;精度评价;质量检测
1.绪论
随着遥感卫星技术与信息技术的飞速发展,遥感图像的获取取到越来越多、获取速度越来越快捷,现在半天的数据获取量就达到了过去将近一年的获取量。
随着数据的爆炸性增长,劣质数据也随之而来,数据可用性受到严重影响。
众所周知,数据的质量决定了信息的可用性,因此对遥感图像的质量检测就越发显得重要[1]。
任何信息产品最终都要服务于社会发展,遥感图像更不例外。
遥感图像从获取需到可应用的专题图中间主要还包括原始图像获取、预处理和信息提取3个方面。
遥感图像的质量检测是贯穿于这整个过程,只有每一步都保证其相应的质量后才可能生成一幅可用的专题产品。
其中可能存在的质量问题简要介绍如下:
(1)原始的遥感图像主要针对其辐射质量的检测,具体面临的质量问题是噪声过多和云量。
噪声的存在降低了图像的质量,有时甚至会完全掩盖数字图像中真正的光谱信息。
在光学遥感中,云覆盖是造成遥感数据可用性降低的重要因素,云量的存在则直接遮掩了地物的光谱信息,导致一景图像失去其可用性。
因此云量检测是遥感影像辐射质量评价的重要内容之一。
(2)图像的预处理阶段主要包括几何校正、图像融合、剪裁镶嵌等操作。
几何校正是为了使两幅或多幅图像的几何坐标相对应,是后续一系列的图像处理的基础,校正的质量将会影响后续所有过程集产品。
如果校正不准确轻则导致图像质量降低,重则导致图像间的操作不能进行。
图像融合是为了获取更丰富的图像信息以便于图像分类、信息提取等操作,一般由低分辨率多光谱信息的影像与高分辨率低光谱信息的影像融合,紧随几何校正进行。
如果融合效果较差会使图像中包涵的可用信息降低,不利于信息提取等最终操作。
图像剪裁和镶嵌是为了得到合适的研究区域,以便于以后的实验研究。
(3)遥感图像信息提取是整个遥感图像应用中最关键的步骤,直接影响了专题产品的质量。
此阶段的质量检测主要针对提取信息的准确度,即与地面实际地物的吻合程度。
因此本次综述以遥感图像处理流程为切入点从原始遥感图像质量检测、预处理后质量检测、信息提取后质量检测三个方面进行简要阐述。
2.原始图像的质量检测
王荣彬、李平湘等针对传统的原始遥感影像辐射质量评价方法多以人工定性评价为主而缺乏客观和易行的定量评价标准的不足,提出了适用于噪声和云量等的评价指标,给出了一种业务化的快速评价方法。
在噪声方面的质量评价通过选取一定大小的均匀区域,采用逆变动系数(ICV)即区域内的均值与方差之比作为评价参数来评价图像质量。
实际应用中需选取多个均匀区域分别计算ICV后再求均值的方法评价质量。
ICA的值越大,噪声对图像质量的影响越小。
在云量的检测方面通过云指数法充分结合图像的光谱信息做出评判。
具体为选取图像的两个波段,短波红外和热红外,通过归一化处理求解云指数(NDCI)即
,其中bd、br分别表示短波红外和热红外,通过设定合适的阈值判断云和非云[2]。
3.预处理后的质量检测
在图像预处理的几个步骤中,几何校正是以后所有图像处理的基础,几何校正的精确与否决定了图像的质量的高低。
图像融合使遥感图像中包涵更丰富的信息,可提高信息提取的准确度。
此阶段的质量检测即主要针对这两个步骤。
图像的剪裁和镶嵌因不涉及图像的波谱等信息,此步骤中的质量问题较少出现,对于剪裁和镶嵌的质量检测不再叙述。
MoréG.和PonsX.对几何校正进行了深入的研究,借助对均方根(RMS)误差的计算,详尽阐明了地面控制点(GCPS)集对校正精度的影响。
在GCPS集足够的情况下,最少应使用25个点才能使校正精度与使用最大量的GCPS的精度相似。
同时,当GCPS集与拟合模型吻合时校正精度要高于独立的GCPS集,鉴于独立GCPS集多由手动生成,且一般可使用的只有25~30个左右,因此在对图像进行几何校正时自动获取的GCPS的校正效果要由于手动获取的结果[3]。
LiYuhai和PanShenlin以最终融合图像质量为检测目标对目前常用的4种图像融合方法(HIS、PHF、PCA、小波融合)进行了全面的研究。
研究中选则融合后图像的均值、标准差与信息熵、相关系数、平均梯度5个参数作为评价指标,发现1)PCA融合方法得到的融合影像的信息熵最大即影像的信息量增加得最多,但影像失真较大;2)HPF融合方法得到的融合影像的相关系数最大,即在保持多光谱影像的光谱信息方面效果较好,同时影像失真也较小;3)PCA融合方法得到的融合影像的评价梯度最大即清晰度最高[4]。
4.信息提取后的质量检测
遥感图像的信息提取通常由图像分类完成,因为图像中混合像元的存在导致分类结果普遍存在一定程度的不确定性。
因此需要对提取的图像进行质量检测在确定其可用性后才能进行最终的应用。
该阶段的质量检验主要包括抽样和检测两个过程。
抽样已经从最早的纯数学中的抽样方法发展到了结合空间学知识的空间抽样。
质量检测大多经过误差矩阵进行系统地评判,误差矩阵已成为使用最多且最成熟的系统评价方法。
4.1抽样设计
传统抽样中,抽样对象一般不具有空间位置概念,常用的抽样方法有简单随机抽样,分层抽样和系统抽样。
这些抽样方法仅仅从数学的角度进行抽样设计,未结合地理空间的实际情况,存在一定的局限性。
地统计学这个方法是由Matheron提出来的[5,6],60年代矿物学家D.R.krige最早将应用于南非金矿的查找。
70年代Tobler指出“地理学第一定律:
任何事物之间都有相关性,相距近的事物比相距远的事物之间更加相关”[7]。
空间数据由于受空间相互作用和空间扩散的影响,彼此之间可能不再相互独立,而是相关的。
因此获取的遥感图像上都存在空间自相关性(spatialautocorrelation),具体表现在图像上为相同的地物类别之间有着相同或者相似的特征(边界、幅度、纹理、灰度值、统计系数等)。
仅仅使用传统的抽样方法而不考虑空间相关性的影响必然会导致抽样结果的不精确,进而影响精度评价的结果。
比如,对于系统抽样,仅从距离的角度抽样,可能会导致抽样地物不全面、比例偏差等问题。
因此,需要一个合适的考虑空间关系的参数作为系统抽样中的距离,以此为依据进行空间上的系统抽样。
Moran'sI是一种度量空间对象之间相关程度的重要参数,在空间自相关分析中得到了广泛的应用。
采用Moran'sI对空间结构进行分析的空间抽样方法考虑了调查对象的空间相关性,因此可以合理的分布样本点,减少样本冗余,降低检验成本。
本文通过Moran'sI量化遥感影像像元之间的距离与相关性之间的关系,如公式所示[8]:
(1)
(2)
(3)
(4)
(5)
其中,
表示Moran'sI指数值,
表示像元的总数,
表示像元
和
之间的空间权重,
表示像元
的属性值,
表示所有像元的属性平均值,
表示所有空间权重的聚合,
表示空间聚类程度z-score标准化值,
表示Moran'sI的期望,
表示Moran'sI的方差,
表示欧氏距离,
表示单元
的经度,
表示单元
的纬度,
表示所有像元中最大经度,
表示所有像元中最小经度,
表示所有像元中最大纬度,
表示所有像元中最小纬度,
表示抽样方法所需样本量,
表示依据
选择的最佳距离。
为了获得最佳距离
,利用公式
(1)对不同距离的遥感影像像元间进行空间相关性分析,通过对Moran'sI值的标准化计算得到z-score值,z-score值反映空间聚类的程度,z-score值越高表示聚类程度越明显,选择聚类程度较明显的z-score值确定取值
,进而通过公式(5)获得抽样方法所需要的样本量。
4.2质量检测
抽样阶段主要是获取检测的原始资料,而后在进行信息提取后的质量检测。
综合考虑评价方法及其评价指标体系和评价结果表达的尺度,可以将它们归类为基于误差矩阵的方法、基于模糊分析的方法、像元尺度上的不确定性评价方法和其它各种方法四大类。
表1给出了四种评价方法的简要对比:
表14种评价方法的对比
类型
不确定性指标
不确定性表达尺度
总体
类别
像元
基于
误差
矩阵
总体精度、生产者精度、用户精度、最小精度值、Kappa系数、条件Kappa系数、加权Kappa系数
有
有
无
Tau系数、条件Tau系数
有
有
无
分类器性能、类别精度、平均地图精度
有
有
无
地图价值
有
无
无
地面实况指数
有
无
无
基于
模糊
评价
误差频率、误差严重程度
有
有
无
模糊相似性指数
有
有
无
交叉熵
有
有
无
模糊相似性
有
有
无
像元
尺度
评价
概率矢量、绝对不确定性,相对不确定性、混合像元程度
无
无
有
证据不完整性、概率熵
无
无
有
相对概率熵、夸大的不确定性、忽略的不确定性
无
无
有
错分概率
无
无
有
分类置信度
无
无
有
其他
方法
方差分析
有
无
无
误差成本
有
有
无
4.2.1基于误差矩阵的分类精度评价方法
1991年Congalton教授将误差矩阵引入到遥感质量评价中,提出了借助误差矩阵进行评价的经典算法,该算法经过20多年的发展与演变,依然是现在主流的质量评价方法。
误差矩阵(errormatrix)又称混淆矩阵(confusionmatrix),是一个用于表示分为某一类别的像元个数与地面检验为该类别数的比较阵列[9]。
从误差矩阵中可以直观地得到每一类别的包含误差(commissionerror)和丢失误差(omissionerror)。
包含误差指不该属于某类别的像元被分为该类别的误差,它由该类别所在行的非对角线元素之和除以该行总和而得;丢失误差指该属于某一类别的像元未被分为该类别的误差,它由该类别所在列的非对角线元素之和除以该列的总和而得[10]。
同时,从误差矩阵中还可以计算出各种精度测量指标,如总体精度,生产者的精度和用户的精度。
总体精度是误差矩阵内主对角线元素之和(正确分类的个数)除以总的采样个数。
生产者精度和用户精度可以表示某一单个类别的精度。
生产者精度为某类别正确分类个数除以该类的总采样个数(该类的列总和);而用户精度定义为正确分类的该类的个数除以分为该类的采样个数(该类的行总和)。
除了以上各种描述性的精度测量,在误差矩阵基础上利用各种统计分析技术可以用于比较不同的分类方法,其中最常用的是Kappa分析技术。
Kappa分析技术是一种多变量统计分析技术,它在统计意义上反映分类结果在多大程度上优于随机分类结果,并可以用于比较2个分类器的误差矩阵是否具有显著差别[11]。
Kappa分析的结果是KHAT统计,从误差矩阵中可以计算总体分类的KHAT统计值和各类别的条件Kappa系数。
一般的Kappa系数及其方差的估计方法是在假设采样模型为多项式模型的基础上发展的,而只有简单随机采样方法满足这个假设。
除了Kappa分析技术,可以通过“边际拟合(Margift)”技术将误差矩阵归一化(或标准化)以便于不同误差矩阵之间的比较。
通过对误差矩阵做归一化处理,可以消除误差矩阵生成过程中因样本数的不同而造成的差异,使不同误差矩阵中任意对应的元素之间具有可比性。
由于在归一化过程中考虑了非对角线元素的信息,与误差矩阵中的总体精度相比,归一化的精度更能代表分类的真实精度[11]。
4.2.2 基于模糊集理论的精度评价方法
在误差矩阵精度评价中由于混合像元的存在,在实际中有时难以找到“纯”的属于某一类别的参考数据,从而使精度评价结果具有偏差。
针对这种情况,模糊逻辑被广泛用于遥感分类不确定性评价以克服参考数据中的模糊性问题。
Gopal[12]等发展了用模糊集理论评价遥感分类专题图精度的方法。
此方法将分类精度在语义上分为绝对错误、可理解的错误、可接受的、好的和完全正确的5个语义精度尺度,通过专家知识得到每个语义尺度的模糊隶属度,然后用模糊推理方法得到分类图像误差的频率、严重程度以及误差源等信息。
模糊集理论评价方法提供了混合像元情况下的误差评价方法,并且可以提供误差的严重程度信息。
不同于用语义尺度评价模糊隶属度,Townsend[13]提出了模糊相似性指数,通过比较参考数据与分类结果的模糊相似性来评价模糊隶属度。
近几年,学术界将概率论和模糊集理论结合,由于这种新的模糊集将随机理论引入传统的模糊域来描述模糊隶属度的随机特性,构建了一个随机轴和模糊轴组成的三维隶属度函数结构,因此能同时处理随机的和模糊的不确定性。
李涵雄,黄文静[14]对概率模糊集做进一步深入的理论研究,建立了系统三角形模糊集系统模型,具有非常高的理论研究价值与广阔的应用前景。
4.2.3 像元尺度上的遥感分类不确定性评价方法
遥感分类数据中误差在空间上并不是随机分布的。
根据不同的地面特征和传感器特性,遥感分类数据中的误差具有一定的空间分布结构。
由于混合像元的存在,一般误差主要分布在类别之间的边缘区域。
误差的空间分布不但有助于探测误差源,而且对以遥感分类结果为数据源的环境模型中不确定性的传播分析非常重要。
Goodchild等[15]提出以贝页斯分类过程中的后验概率矢量为基础在像元尺度上评价分类不确定性。
在概率矢量基础上,发展了一系列像元尺度的分类不确定性评价指标,包括绝对不确定性、相对不确定性、混合像元程度、证据不完整性、概率熵和相对概率熵等。
与概率矢量的思想类似,Zhu[16]利用模糊分类过程中的模糊隶属度,提出以模糊隶属度矢量为基础进行分类不确定性评价与以上思路不同,Steele[17]提出了一套估计训练样点上像元错分概率的估计方法,然后通过空间内插估计像元尺度上错分概率,实现了以错分概率为指标的像元尺度分类不确定性评价。
4.2.4 其它方法
除了上述几种遥感分类不确定性评价方法外,还有一些不常用的方法从不同的角度评价分类不确定性。
如Rosenfield[18]利用加权的方差分析技术分析遥感分类不确定性评价不同类别中样本点数目差异的影响。
Smits[19]从遥感专题分类精度、专题数据应用目标和精度评价费用之间的联系出发,提出了考虑精度评价费用的分类不确定性评价方法。
巫兆聪、易丽娜[20]以面向对象遥感影像分类为主线,分析了分类过程中的各种不确定性来源,提出了以对象为单元的影像分割和分类精度评价方法,为控制不确定性,提高分类精度提供了依据。
4.3遥感专题分类不确定性评价方法的分析
虽然从误差矩阵可以得到诸如总体精度、生产者精度、用户精度,以及Kappa系数等多个精度度量指标,并且已经成为遥感数据分类精度评价的核心方法。
但在实际应用中,仍然存在许多问题。
研究证明,由于在Kappa系数计算过程中实际高估了偶然一致性(changeagree),使总体分类精度被低估[21]。
Ma等[22]同样认识到这个问题,并建议用Tau系数代替Kappa系数作为误差矩阵的精度指标。
Wang,H.Y.、Wang,X.Q.、Dou,A.X.(2012)鉴于kappa系数只能反映总体精度的不足,将地震预报效果评估的R-VALUE引入到针对图像某一特殊分类类别的精度评估中,生成了更加精细的误差矩阵。
通过实验发现两种方法的精度评价结果相似,但R-VALUE方法可以得到比kappa系数评估方法丰富得多、精细得多的评估信息,借助这些信息可以得到更加精确的质量评估标准[23,24]。
模糊精度评价方法在一定程度上解决了地面参考类别“不纯”的问题。
然而,通过利用专家知识获取模糊隶属度的方法具有很大的主观性和随意性,不同的评价结果之间不便比较。
而且,由于它只提供了参考数据中类别之间的混淆的信息,因此它的精度信息远不如Kappa统计丰富。
同时,在实际应用中,建立模糊逻辑推理的规则并不是一件容易的工作;另外,基于模糊集理论的精度评价方法仍然存在基于误差矩阵的分析中的采样问题以及误差的空间分布和可视化表达问题。
随着遥感与GIS被越来越多的用于资源、环境问题的分布式模拟和提供决策支持,像元尺度上的遥感分类不确定性,或者说,遥感专题分类不确定性的空间分布信息,已经变得越来越重要。
现有的像元尺度上遥感分类不确定性评价方法的缺陷在于:
首先,评价指标直接依赖于图像分类所用的分类器。
如由于概率矢量只能从贝叶斯分类方法中得到,基于概率矢量的评价方法只能用于贝页斯分类器的分类结果。
同样,基于模糊隶属度矢量的指标也只能用于模糊分类结果的评价。
对于其它各种常用遥感数据分类器的分类结果,如何在像元尺度上评价分类不确定性仍然没有解决。
其次,缺乏相对统一的不确定性指标体系。
由于评价方法和指标系统直接从分类过程中得到,因此不确定性评价的指标多样而互相没有可比性。
而且,即使同样从概率矢量中得出的不确定性指标也多种多样,每个指标的意义不够明确,指标间的相互关系也不明确。
因此,发展像元尺度上遥感分类不确定性评价的一般方法和指标体系应该作为当前遥感分类不确定性评价研究的优先领域。
5.总结
遥感图像信息的质量评价至关重要,发展至今以形成了许多有效的评价方法。
但是遥感数据的质量评价是一个综合的过程,如何全面的解决质量评价问题成为一个重要的研究方向。
基于误差矩阵的方法是目前遥感分类不确定性评价的核心方法,但其精度评价指标依然存在许多争论,采样问题和参考数据的精度问题是影响评价结果的重要问题。
同时,基于误差矩阵的方法不能反映误差的严重尺度,也不能反映不确定性的空间分布特征。
基于模糊逻辑的不确定性评价方法可以在一定程度上解决参考数据的精度问题,但同样存在误差矩阵方法中的采样问题和不能反映不确定性空间分布特征的问题。
而且获得模糊隶属度的过程具有很大的主观性,不便于不同结果间的比较。
像元尺度上的不确定性评价方法可以反映遥感数据分类不确定性的空间分布,而且没有采样问题引入的偏差。
但目前像元尺度上遥感分类不确定性评价方法的主要问题是评价方法依赖于分类方法,没有相对统一的不确定性评价指标体系。
从整个遥感分类不确定性评价方法的角度来看,不同类型评价方法(基于误差矩阵的方法、基于模糊逻辑的方法和像元尺度的评价方法)的指标体系之间无法互相对比,不同指标体系所表达的不确定性之间难以建立联系。
遥感图像从获取到应用之间每个阶段内都需整体评价,比如在原始图像中可以使用加权系数将噪声和云量两个指标结合进行质量评价,而且原始影像中还有其他影响质量的参数,这些参数都应该被整体考虑,整体参与评价。
在对提取后的遥感图像进行质量检测时如何得到准确的误差矩阵是质量评价的关键。
因此需要将其他领域的方法建设性地引入到遥感质量检测中产生更多可以提高质量检测的精度方法。
参考文献:
[1]李建中,刘显敏.大数据的一个重要方面:
数据可用性[J].计算机研究与发展,2013,50(6):
1147-1162.
[2]王荣彬,李平湘,季宏伟等.遥感影像的辐射质量评价方法[J].遥感信息,2015,
(2).DOI:
10.3969/j.issn.1000-3177.2015.02.002.
[3]WangH,WangX,DouA.Studyontheprecisionevaluationmethodforaspecificcategoryintheclassificationofremotesensingimage[C]GeoscienceandRemoteSensingSymposium(IGARSS),2012IEEEInternationalIEEE,2012:
978-981.
[4]LiY,PanS.TheQualityAssessmentofFusionEffectForRemoteSensingImage[C]RemoteSensing,EnvironmentandTransportationEngineering(RSETE),2011InternationalConferenceon2011:
2724-2727.
[5]MatheronG.Principlesofgeostatistics.EconomicGeology,1963,58:
1246-1266.
[6]MatheronG.Krigingorpolynomialinterpolationprocedures.CanadianMiningandMetallurgicalBulletin,1967,60:
1041-1045.
[7]WangJinfeng,ZhuangDafang,LiLianfa.Spatialsamplingdesignformonitoringtheareaofcultivatedland.InternationalJournalofRemoteSensing,2002,13
(2):
263-284.
[8]陶吉兴,傅伟军,姜培坤等.基于Moran'sI和地统计学的浙江森林土壤有机碳空间分布研究[J].《南京林业大学学报(自然科学版)》,2014,38(5):
97-101.
[9]CongaltonRG.Areviewofassessingtheaccuracyofclassificationsofremotelysenseddata[J].RemoteSensingofEnvironment,1991,37(91):
35–46.
[10]PadillaM,StehmanSV,RamoR,etal.Comparingtheaccuraciesofremotesensingglobalburnedareaproductsusingstratifiedrandomsamplingandestimation[J].RemoteSensingofEnvironment,2015:
114–121.
[11]CongaltonRG,Greenk.AssessingtheAccuracyofRemotelySensedData:
PrinciplesandPractices[M].BocaRato:
LewisPublisher,2008.
[12]GopalS,WoodcockC.Theoryandmethodsforaccuracyassessmentofthematicmapsusingfuzzysets[J].PhotogrammetricEngineering&RemoteSensing,1994,60
(2):
181-188.
[13]TownsendPA.AQuantitativeFuzzyApproachtoAssessMappedVegetationClassificationsforEcologicalApplications[J].RemoteSensingofEnvironment,2000,72(3):
253-267
[14]李涵雄,黄文静.概率模糊集理论研究极其建模[D].中南大学,2013
[15]MICHAELF.GOODCHILD,SUNGUOQING,YANGSHIREN.Development