基于稀疏表示的鲁棒人脸识别汇总.docx

资源描述

基于稀疏表示的鲁棒人脸识别汇总.docx

《基于稀疏表示的鲁棒人脸识别汇总.docx》由会员分享，可在线阅读，更多相关《基于稀疏表示的鲁棒人脸识别汇总.docx（13页珍藏版）》请在冰豆网上搜索。

基于稀疏表示的鲁棒人脸识别汇总.docx

基于稀疏表示的鲁棒人脸识别汇总

数字图像处理期末大作业（报告）

基于稀疏表示的鲁棒人脸识别

RobustFaceRecognitionviaSparseRepresentation

学院（系）：

创新实验学院

专业：

信息与通信工程

学生姓名：

李润顺

学号：

21424011

任课教师：

马晓红

完成日期：

2015年7月20日

大连理工大学

DalianUniversityofTechnology

摘要

人脸识别是现代生物信息识别中的一项重要技术，对于给定的人脸图像，利用已经存储的人脸数据库确认该图像中的一个或多个人的身份。

现有的人脸识别方法大多需要进行图像预处理及复杂的特征提取，选择何种特征对识别率影响非常大，并且对遮挡、噪声等情况缺少鲁棒性，这些问题往往使得现有的识别方法在应用中受到制约。

不同于传统的人脸识别算法，稀疏表示通过最小范数计算得到的[1]，文献[1]提出了一个用于（基于图像）目标识别的一般分类算法。

这个新框架对人脸识别中两个重要问题（特征提取和遮挡鲁棒性）提出了新思路。

稀疏表示是压缩感知中的关键理论，数据的稀疏表示，可以从本质上降低数据处理的成本，提高压缩效率。

稀疏表示用在分类识别上有独特的优势，对于特征提取，如果我们在识别中适当地利用稀疏性，特征的选取不再至关重要，然而，重要的是特征数目是否充分大，稀疏表示是否得到准确计算。

只要特征空间维数超过某个阈值（用稀疏表示理论估计得到），非传统特征例如下采样图像和随机投影和传统特征例如特征脸和拉普拉斯脸效果一样。

利用这些误差相对于标准基是稀疏的事实，这个框架可以处理因遮挡带来的误差。

本次课程设计主要通过阅读文献[1]，理解基于稀疏表示的人脸识别，并对算法实现仿真和对比。

由于文献[1]中的实验繁多，本报告只对正常图像和噪声污染图像的人脸识别实验进行重现。

关键词：

压缩感知；稀疏表示；人脸识别；特征提取；最小范数；

1引言

1.1人脸识别的背景及意义

随着社会的网络信息化程度的不断提高，人类身份的数字化和隐性化特征也日趋明显，随之而来的关乎信息安全的身份鉴别问题也就成了一个关键性问题。

比较传统的身份鉴别方法有身份证、个人签名、IC卡、条形编码等方法。

随着科技的发展和计算机网络的普及，这些身份鉴别方法变得不再安全。

这时候，生物识别技术的出现，为当今社会的身份认证提供了更安全，更准确，更快速的方法。

利用人体生物特征进行身份认证的技术叫做生物识别技术。

生物识别技术主要利用人体自身的一些生理特征，如脸像、指纹、虹膜等，结合行为特征，如语音、笔迹、姿态等，再通过计算机技术与声学、光学、生物信息学和生物统计学原理等领域的技术手段来进行个人身份的鉴定。

生物特征较难模仿或伪造，并且使用时不用担心丢失或忘记携带，因此生物识别技术相比传统的身份鉴定方法更具安全性、保密性和便捷性[2]。

人脸识别是生物识别技术中一个重要的研究领域。

人脸识别是指从静态人脸图像或动态视频图像中检测到人脸，结合计算机技术，将人脸身份识别出来。

人脸识别问题一般可描述为：

给定一个包含人脸的场景，可以是静态图像或动态视频，与已经存储的人脸数据库中的图像进行比对，识别出该图像中人脸的身份。

人脸一向被认为是基于图像的识别中最广泛的研究课题。

一部分是因为人类视觉系统的强大的人脸识别能力，另一部分是因为人脸识别技术有许多重要的应用。

另外，人脸识别的相关技术问题也是目标识别甚至一般的数据分类问题中具有代表性的问题。

一般人脸识别的过程如图1所示。

图1人脸识别流程图

1.2人脸识别研究现状

人脸识别方法总体上可以分为基于局部特征的方法和基于整体的方法两种。

基于局部特征的方法是从人脸上获取一系列的几何特征进行识别，基于整体的方法考虑了人脸模式的全局特性，将人脸作为一个整体来识别。

人脸识别常用的方法主要有以下几类[3]：

基于几何特征的人脸识别、基于子空间的人脸识别、基于神经网络的人脸识别。

1）基于几何特征的人脸识别：

最早的人脸识别采用最直观的人脸特征—几何特征进行人脸识别。

基本思想是从人脸几何特征中提取信息作为特征参数，形成特征向量，继而对这些特征向量进行分类处理。

基于几何特征的人脸识别特征比较直观，计算量也不大，但是对光照、遮挡、表情、姿态变化的鲁棒性较差。

而且，由于只计算人脸部件的形状与结构，忽略了局部细节，因此也丢失了部分信息，识别率不高，稳定性也不够，实际应用比较困难。

2）基于子空间的人脸识别：

基于子空间的方法是最为常用的人脸识别方法。

基本思想是把人脸看成一个矩阵或高维向量，通过一个空间变换，把原始人脸图像变换到一个子空间。

子空间中，在不破坏原始人脸结构的前提下，人脸的表示更为紧凑，从而降低了计算的复杂度，也使分类更为准确。

空间变换可以是线性的或者非线性的。

常用的线性变换有主成分分析（PCA）、独立成分分析（ICA）、线性判别分析（LDA）等；非线性变换有流形学习法、基于核技术的非线性子空间分析方法等。

3）基于神经网络的人脸识别：

因为神经网络具有良好的学习能力，因此该方法就利用这种能力对人脸图像进行特征提取并识别。

Paul最早提出使用神经网络对人脸几何特征进行提取。

S.Ranganatn和K.Arun提出径向基神经网络用于人脸识别利用非监督和监督两种神经网络相结合的方法进行人脸识别，其中，非监督网络用于特征提取，而监督网络则进行识别。

基于神经网络的识别方法即使在困难的情况下也可以完成识别工作，因为它有很强的学习能力，能够对比较难描述的人脸进行多次学习，得到规律的隐性表达。

同时在信息处理和编码压缩等方面效果也很显著，但是训练时间长，神经元数目多，导致运算速度较慢，这也是它最明显的缺点。

虽然人脸识别是一种高效、简单、易于实现和普及的识别方法，但是在实际用中，依然存在很多难以克服的问题[4]：

（1）对环境影响较为敏感。

周围环境如光照强度、光源方向、环境色彩等，这些因素的变化使得人脸图像也随之产生较大的变化，这些变动因素会使得针对人脸的检测和识别遇到很大的困难。

（2）人脸表情、角度等的复杂性和变化性。

不同图像中人脸的表情、角度、大小等要素有较大差异，因此人脸所呈现出来的姿态具有极大的不确定性，另外遮挡腐蚀等问题，都给人脸的检测带来了很大的困难。

（3）对微小的差别不敏感。

当人脸比较相似，甚至只在极其细微的部分有差别的时候，漏检测或误检测的比率就会上升。

Candes和Donoho[5]在相关研究基础上于2006年正式提出了压缩感知（CompressSensing,CS）的概念。

它的独特之处在于对信号的采样与压缩过程同时进行，而不像传统方式，先采样后压缩，产生大量的无用数据。

对信号进行非自适应线性投影值进行采样得到观测值，再通过一定的重构算法恢复原始信号。

压缩感知理论依赖于两条原则：

稀疏性和不相干性。

文献[1]利用压缩感知的稀疏性原则，提出了基于稀疏表示的人脸识别方法，包括稀疏表示分类方法下的特征提取，论证了用稀疏表示进行人脸识别的鲁棒性，以及有遮挡、噪声与未配准等情况人脸图像的识别方法。

在假设不考虑姿态变化，只考虑表情变化的情况下并做了大量的仿真与对比，验证了基于稀疏表示的人脸识别方法的优越性。

2基于稀疏表示的人脸识别方法

2.1基于稀疏表示的分类

人脸识别的一个基本问题是如何利用标记过类别信息的训练样本将新的测试样本正确归类。

将第类的个训练样本作为列向量，排列成矩阵。

具体的就是将一副的灰度人脸图像作为列向量（），由这些列向量构成过完备字典。

2.1.1测试样本是训练样本的线性稀疏组合

假定第类有足够多的训练样本，则来自同类的测试样本近似处于这些训练样本张成的子空间中：

（1）

其中是标量，。

由于测试样本所属类别是未知的，我们定义一个新的矩阵，其列由个类别的所有训练样本构成：

（2）

这样，可以重写为所有训练样本的线性表示：

（3）

其中是一个系数向量，其中只有第类的值非零。

由于中的元素包含测试样本的信息，故可以考虑求解线性方程组。

用全部训练样本求解与最近邻分类（NN）和最近邻子空间（NS）（NN每次只用单个样本，NS每次只用一类样本）有很大不同。

这种用全局表示得到的分类器要好于局部方法（NN和NS）。

它可以更好的对用训练样本表示的对象进行识别，还能够排除不属于训练样本集中任何一类的无关样本。

显然，如果，方程组是超定的，可求得唯一解。

但在人脸识别中，经过降维后训练样本构成的方程组是欠定的，解不唯一。

按照惯例，这个难题可以用最小解决：

s.t.（4）

尽管通过的伪逆，这个最优问题很容易求解，但中没有特别丰富的信息用于识别测试样本，因为通常是稠密的，较大的非零元素分布在很多类的训练样本上。

为了解决这个难题，我们可利用一种简单的观测：

一个有效的测试样本只用该类中的训练样本充分表示。

如果类别数大到一定程度，这个表示自然是稀疏的。

例如，如果，中只有5%的元素非零。

恢复的越稀疏，就越容易确定测试样本的类别。

因此为了找到的最稀疏解，可求解下面的最优问题：

s.t.（5）

2.1.2最小范数求稀疏解

范数优化问题是难问题，需用其它方法替代解决。

当解足够稀疏时，最小范数和最小范数是等价的，故可转化为最小范数问题：

s.t.（6）

到目前为止，我们都是假设（3）是精确的。

但实际数据是有噪声的，用训练样本的稀疏叠加难以精确地表示测试样本。

可以通过改写模型（3）处理含小噪声的问题：

（7）

其中是噪声项，能量范围。

稀疏解仍可以大致地通过求解下面的稳定最小范数得到重构：

s.t.（8）

这个凸最优问题可以通过二阶锥规划有效解决。

有人指出是随机矩阵时，通过（8）可以基本重构稀疏解。

对于常数和，如果，，则所求解以极大的概率满足：

（9）

2.1.3基于稀疏表示的分类

对于给定的属于第类的测试样本，通过（6）可以求出稀疏表示。

理想情况是，估计的非零元素只存在于对应着中第类的位置，由此便容易判断出的归属类别。

然而，由于噪声及模型误差的存在，其它类别也存在小的非零值。

基于全局稀疏表示，我们可以设计许多可行的分类器。

一般来说，类别数较多且类别中样本个数较少时，系统会有较大误差，此时可以简单地将中最大元素所属类别视为的类别；但当类别数适中且每类训练样本个数较多时，可用下面的重构误差方法进行判断。

对于每一类，令是选择与第类相关的系数的特征函数，对于，向量中的非零元素为中与第类相关的元素。

只用与第类相关的元素，我们可以将测试样本的估计值写为，计算所有与之间的差，并将归于使残差最小的类：

（10）

稀疏表示分类算法如下：

1）输入：

类的训练样本矩阵，测试样本，（可选误差容限）。

2）将中所有列向量归一化到单位长度。

3）求解最小范数问题：

s.t.（11）

（或选s.t.）

4）对，计算重构残差。

5）输出。

2.2结合特征提取的稀疏表示方法

特征提取的好处就是降低数据维数及减少计算代价。

对于原始的人脸图像，其对应的线性系统十分庞大。

例如，假设给定的人脸图像的分辨率为像素，维数将达到数量级。

虽然算法是基于可扩展的方法，例如线性规划，但是直接应用于如此高分辨率的图像仍然超出了常规计算机的能力。

既然大部分的特征变换都只涉及线性操作（或类似），那么从图像空间到特征空间的投影就可以表述成一个矩阵，其中。

将R同时应用到等式（3）的两边：

（12）

事实上，特征空间的维数是远远小于的。

在这种情况下，线性方程组在未知的情况下是欠定的。

但是，既然期望的解是稀疏的，就希望通过解如下简化的最小范数来重构它：

s.t.（13）

其中是误差容限。

因此，算法中的训练图像的矩阵现在变成了维的特征矩阵；测试图像用它的特征取代。

2.3稀疏表示分类器对遮挡和噪声的鲁棒性

展开阅读全文