第4章-1-高光谱数据降维与可分性准则.ppt
《第4章-1-高光谱数据降维与可分性准则.ppt》由会员分享,可在线阅读,更多相关《第4章-1-高光谱数据降维与可分性准则.ppt(66页珍藏版)》请在冰豆网上搜索。
1,高光谱遥感第四章高光谱数据处理,第四章高光谱数据处理主要内容,高光谱数据的特征选择与提取高光谱特征参量化高光谱遥感影像分类与光谱匹配混合光谱,2,第1节高光谱数据降维与可分性准则,高光谱遥感第四章高光谱数据处理,3,一、高光谱数据的降维问题二、类别可分性准则三、基于几何距离的可分性准则四、基于类的概率密度的可分性准则,第四章第1节高光谱数据降维与可分性准则,4,高光谱分辨率的影响,在给定的波长区间内,高的光谱分辨率导致影像波段数众多、连续。
一方面,高光谱遥感的核心优势是反映光谱特征的细微差异;另一方面众多的波段数目给数据处理带来新的问题。
一、高光谱数据的降维问题,1.1高光谱数据的高维特征,5,波谱空间与光谱空间,波段数众多导致光谱空间维数的增多,一、高光谱数据的降维问题,1.1高光谱数据的高维特征,波段数众多导致波谱曲线信息的丰富,“维数”是指光谱空间的维数,6,高光谱影像属于高维空间数据,已有的研究结果表明,这种数据有许多不同于低维数据的分布特性,这些特性决定了人们在对高光谱影像分析时应采用不同策略和方法。
一、高光谱数据的降维问题,1.1高光谱数据的高维特征,7,1.信息冗余大,波段数量多,但并非每个波段在任何时候都是有用信息。
波段之间的相关性导致信息冗余很大,尤其是相邻波段之间的相关性很强。
一、高光谱数据的降维问题,1.2高维特征带来的新问题,例如:
对于有N个波段的高光谱数据来讲,当前应用需求是区分w1类和w2类。
如果利用任意一个波段都能达到这个目的,那么,仅取一个波段就包含了足够信息,其余N-1维特征就是多余的。
8,根据超维立方体的体积公式,随着空间维数的增加,超立方体的体积急剧增加,并且向角部分布。
一、高光谱数据的降维问题,1.2高维特征带来的新问题,2.超维几何体体积,9,一、高光谱数据的降维问题,1.2高维特征带来的新问题,2.超维几何体体积,伽马函数,超立方体中内切求的体积与超立方体之比,10,例如:
密度分析GRID算法,一、高光谱数据的降维问题,1.2高维特征带来的新问题,2.超维几何体体积,由于体积因素影响,高维空间中数据的分布呈现出稀疏、严重不规则等特点,使得常规的分析算法效果不佳。
11,思考:
既然不同波段包含了不同光谱信息,那么,在利用遥感影像分类时,是否波段越多,分类越精确?
研究表明,事实并非如此,一、高光谱数据的降维问题,1.2高维特征带来的新问题,3.“维数灾难”问题,12,高光谱遥感数据有助于我们完成更加细致的遥感地物分类和目标识别,然而波段的增多也必然导致信息的冗余和数据处理复杂性的增加。
具体表现在:
(1)数据量急剧增加:
波段的增加,使得高光谱数据比传统数据多1-2个数量级,表现在显示,存储,管理方面相当繁琐;假设原始光谱波段数为N,优选后的光谱波段是M,NM,则:
光谱特征组合的数目为:
N!
/(N-M)!
M!
100!
/(100-3)!
3!
=161,700,
(2)计算量增大:
数据的膨胀导致计算机处理载荷大幅度增加,寻找有效地降维空间手段是必要的;(3)统计参数的估计误差增大:
随着波段数增多,样本的统计参数也要求越多。
为达到比较精确的参数估计,训练样本数应当是所用波段数的10倍以上。
在样本数不变的情况下,分类精度随所使用波段数的变化呈现出Hughes现象。
13,14,一、高光谱数据的降维问题,1.2高维特征带来的新问题,3.“维数灾难”问题,15,这说明高光谱数据区分地类之间的能力极大地受到训练样本的限制,在分析高光谱影像时,要获得好的分类精度就需要更多的训练样本。
如果训练样本不足时,往往会出现在样本点数目一定的前提下,分类精度随着特征维数的增加“先增后降”的现象,这就是所谓的Hughes”维数灾难”现象。
一、高光谱数据的降维问题,1.2高维特征带来的新问题,3.“维数灾难”问题,16,随着空间维数的增加,要得到同样精度的估计值将需要更多的样本数。
研究表明,对于监督分类而言,若要得到比较满意的分类结果:
一、高光谱数据的降维问题,1.2高维特征带来的新问题,4.高维空间中的参数估计问题,线性分类器需要的样本数与空间的维数呈线性关系。
对于基于二次估计量的分类器,所需的样本数与空间的维数呈平方关系。
17,模式识别的类别统计信息,参数估计不准确,分类精度较低,一、高光谱数据的降维问题,1.2高维特征带来的新问题,4.高维空间中的参数估计问题,因此,“维数灾难”现象可以从样本数量与数据复杂度关系理论来解释,18,在高维数据空间中,除了数据点分布的绝对位置以外,数据分布的形状和方向对于分类具有更加重要的影响作用。
一、高光谱数据的降维问题,1.2高维特征带来的新问题,5.高阶统计特性,19,一、高光谱数据的降维问题,1.2高维特征带来的新问题,5.高阶统计特性,20,在低维空间,只使用均值向量进行分类的结果比只使用方差信息得到的结果的精度高,说明在此种情况下,在分类过程中数据分布的位置比分布的形状和方向作用要大的多,这也是人们通常遇到的情况。
但是,当维数增加时,只考虑均值信息进行分类的精度并不再增加,而考虑方差信息的分类精度却随着特征维数的增加而继续增加。
一、高光谱数据的降维问题,1.2高维特征带来的新问题,5.高阶统计特性,21,综上所述,高维特征引起了多种问题,因此,在高光谱数据应用的特定阶段,可以对高维数据进行降维处理,得到具有代表意义的低维光谱特征,并在低维光谱空间中进行相应分析(聚类分析)。
信息冗余大超维几何体体积“维数灾难”问题高维空间中的参数估计问题高阶统计特性,一、高光谱数据的降维问题,1.2高维特征带来的新问题,22,一、高光谱数据的降维问题,1.3高光谱降维,方法:
波段选择特征变换,23,注意不要走向另一个极端:
降维绝对不是对高维光谱信息的舍弃,而是立足于高维数据,针对不同的使用目的得到相应低维数据。
图书馆的书种类繁多,不同专业的同学各取所需,只选一小部分,但并不意味着其它的书是多余的。
一、高光谱数据的降维问题,1.3高光谱降维,24,高光谱数据降维的方法,波段选择特征变换,降维后得到的低维特征空间是否有效进行类别区分?
一、高光谱数据的降维问题,1.3高光谱降维,25,一、高光谱数据的降维问题二、类别可分性准则三、基于几何距离的可分性准则四、基于类的概率密度的可分性准则,第四章第1节高光谱数据降维与可分性准则,26,降维得到低维特征,可分性判据,定量化的指标,指导降维,二、类别可分性准则,2.1高光谱数据降维与类别可分性判据的关系,27,概念:
从高维数据中得到了一组用来分类的特征,需要一个定量的标准来衡量特征对分类的有效性。
2.2可分性准则基本概念,可分性准则,二、类别可分性准则,可分性准则的主要类型:
基于几何距离的可分性准则基于概率密度的可分性准则,特点:
通过已知类别先验知识,衡量当前特征空间对类别的区分效果。
光谱可分性准则,基于几何距离可分,基于类的概率密度可分,各样本间的平均距离,类别间的相对距离,欧氏距离,马氏距离,明氏距离,归一化均值距离等,离散度,J-M距离,29,一、高光谱数据的降维问题二、类别可分性准则三、基于几何距离的可分性准则四、基于类的概率密度的可分性准则,第四章第1节高光谱数据降维与可分性准则,30,不同的类别不同的分布区域,类别可分性区域可分性,区域可分性通过几何距离来度量,三、基于几何距离的可分性准则,3.1基本思想,31,32,1.点与点的距离,在,维特征空间中,特征点,与特征点,之间的欧氏距离为:
3.2几何距离可分性准则原理,三、基于几何距离的可分性准则,基于几何距离的可分性准则-欧氏距离,特点:
利用各样本间距离的平均值作为可分性准则,欧几里德距离表达式(其中i,j为样本,k为波段):
欧氏距离含义:
随着各样本间的平均距离增加,类别间的可分性增加。
34,各类样本之间的距离越大,类别可分性越大,因此可以利用各类样本之间的距离的平均值作为可分性的准则。
常用的距离函数有:
欧氏距离,马氏距离,明氏距离等。
35,两种分布的可分离性比较,需要注意:
很多情况下,类别之间的平均距离并不一定代表了类别之间的可分性。
如下图所示:
36,2.点与点集的距离,3.2几何距离可分性准则原理,三、基于几何距离的可分性准则,37,类别间与类别内的相对距离,根据费歇尔准则,分类时总是希望类内的离散度尽量小,类间的离散度尽量大,那么根据这个定律,可以作为相对距离的一个度量,度量的公式,都是根据类内和类间离散度矩阵来进行定义。
38,总体的均值矢量,类内的均值矢量,3.类内及总体的均值矢量,3.2几何距离可分性准则原理,三、基于几何距离的可分性准则,39,类内均方欧氏距离定义为:
类内均方距离也可定义为:
3.2几何距离可分性准则原理,4.类内距离,先求出各自到类心的距离的平方,再求和,两两运算,不涉及类心,三、基于几何距离的可分性准则,40,类内离差矩阵,反映类内部样本在均值周围的散布情况。
3.2几何距离可分性准则原理,5.类内离差矩阵,三、基于几何距离的可分性准则,41,两类样本之间的距离,3.2几何距离可分性准则原理,6.两类之间的距离,三、基于几何距离的可分性准则,42,取欧氏距离时,总的均方距离为,总的样本距离,3.2几何距离可分性准则原理,7.各类总的均方距离,三、基于几何距离的可分性准则,43,A.总的类内离差矩阵,3.2几何距离可分性准则原理,7.多类情况离差矩阵,三、基于几何距离的可分性准则,44,B.类间离差矩阵,3.2几何距离可分性准则原理,7.多类情况离差矩阵,三、基于几何距离的可分性准则,45,实质是样本总体的协方差矩阵不涉及类的概念,C.总体离差矩阵,3.2几何距离可分性准则原理,7.多类情况离差矩阵,三、基于几何距离的可分性准则,基于几何距离的可分性准则-归一化均值距离,特点:
光谱可分性准则同时考虑了类间距离和类内方差,归一化均值距离(normalizeddistancebetweenthemeans)表达式:
平均距离增加,类均值相等,分布离散度增加,47,点与点的距离,如何通过几何距离衡量可分性?
三、基于几何距离的可分性准则,3.3判据构造,1.离差矩阵分析,48,类的内部越紧密越好类之间越分散越好,三、基于几何距离的可分性准则,3.3判据构造,1.离差矩阵分析,49,原则:
数值的大小直接体现降维后特征空间的类别可分性。
常见判据:
3.3判据构造,2.依据可分性准则构造判据,三、基于几何距离的可分性准则,50,一、高光谱数据的降维问题二、类别可分性准则三、基于几何距离的可分性准则四、基于类的概率密度的可分性准则,第四章第1节高光谱数据降维与可分性准则,51,先验概率后验概率条件概率,在样本集中,预先已知的某一类出现的概率P(Wi),对于样本集中的某一模式x,它属于某类Wi的概率P(Wi|x),在某一类Wi中,模式x出现的概率P(x|Wi),4.1基本概念回顾,四、基于概率密度的可分性准则,52,100%,各类的条件概率密度函数P(x|Wi)重叠度越低,特征可分性越好。
四、基于概率密度的可分性准则,4.2概率密度分析,53,可分性判据的设定,基本性质:
Jp=0;当两类概率密度完全不重叠时,Jp取最大值;当两类概率密度完全重叠时,Jp等于0;两类概率密度具有“对称性”。
四、基于概率密度的可分性准则,4.3基本性质,4.1.1光谱可分性准则,基于概率密度的可分性准则
(1)-离散度(divergence),离散度与归一化距离的关系,分类精度与归一化距离的关系,特点:
可分准则基于类条件概率之差。
55,离散度,相对距离是基于类间距离和类内方差,类内方差越大,分类误差越大。
而离散度则是基于条件概率之差,表达式为:
代表某一点的似然比代表似然比的自然对数E代表期望值,基于概率密度的可分性准则
(2)-J-M距离,特点:
与离散度一样,也是基于类条件概率之差。
表达式理解:
(1)J-M距离是的单调递增函数;
(2)