基于肤色的人脸检测算法研究毕业论文Word文档格式.docx

上传人:b****3 文档编号:17927423 上传时间:2022-12-12 格式:DOCX 页数:24 大小:501.06KB
下载 相关 举报
基于肤色的人脸检测算法研究毕业论文Word文档格式.docx_第1页
第1页 / 共24页
基于肤色的人脸检测算法研究毕业论文Word文档格式.docx_第2页
第2页 / 共24页
基于肤色的人脸检测算法研究毕业论文Word文档格式.docx_第3页
第3页 / 共24页
基于肤色的人脸检测算法研究毕业论文Word文档格式.docx_第4页
第4页 / 共24页
基于肤色的人脸检测算法研究毕业论文Word文档格式.docx_第5页
第5页 / 共24页
点击查看更多>>
下载资源
资源描述

基于肤色的人脸检测算法研究毕业论文Word文档格式.docx

《基于肤色的人脸检测算法研究毕业论文Word文档格式.docx》由会员分享,可在线阅读,更多相关《基于肤色的人脸检测算法研究毕业论文Word文档格式.docx(24页珍藏版)》请在冰豆网上搜索。

基于肤色的人脸检测算法研究毕业论文Word文档格式.docx

人脸检测问题的难度在于:

(1)人脸是一个非刚性模式,有各种姿态、表情的变化,不同人脸在细节如形状、大小、颜色上都有差异,即人脸本身是不规则的复杂模式,具有模式的可变性;

(2)背景与光照的不确定性,如在复杂的背景中,不同的采集条件下的光源方向、明暗、色彩都会影响输入图像的质量:

(3)人脸可能有的装饰物会增加检测的难度,如戴眼镜、口罩,化妆,脸上长有的胡须、黑斑等。

因此,如果能找到解决这些问题的方法,成功构造出人脸检测系统,将为其他具有类此特征和模式的检测问题提供重要的启示。

但从客观而言,以上一些难点致使完全不加条件限制的人脸检测无法具有健壮性,目前大多数人脸检测技术只针对正面端正人脸的检测,且有很多方法运算量特别大,时间复杂度高,虽然对于一定的应用来说,他们也是可以接受的,但为进一步提高实用价值,人脸检测系统需尽量弱化对待检图像的条件限制,并且最好能实时检测出人脸。

人脸检测研究重点将越来越趋向于复杂背景下、多姿态人脸的检测。

为向此目标靠近,我从人脸的显著特征之一——肤色入手,研究肤色特征的表达方式,即研究了各种不同色彩空间下的肤色模型,使之具有一定的实用价值且成为将来基于肤色人脸检测研究的一块基石。

1.2人脸检测技术的国内外研究现状

人脸检测问题是计算机视觉领域中的重要问题,最初作为人脸自动识别系统的定位环节被提出,近年来由于其在安全访问控制、视觉监测和新一代人机界面等领域的应用价值,开始作为一个独立的课题受到研究者的重视。

人脸检测问题在近十年中得到了深入的研究并取得了长足的发展,国内外的很多学者提出了许多不同的方法,在不同的领域都取得了不同的成果,但是要寻找一种准确率很高的、能普遍适用于各种复杂情况的人脸检测算法,还有一定的距离。

国外的主要研究单位有美国的麻省理工媒体实验室(MITMedialab)、卡耐基梅隆大学的人机交互学院(Humancomputerinterfaceinstitute)、微软研究院的视觉技术研究组(VisionTechnologyGroup)、英国剑桥大学工程系(DepartmentofEngineering)等,国内的微软亚洲研究院、中科院自动化研究所、清华大学、北京工业大学等都有专业人员从事人脸检测的相关研究。

而且,MPEG7标准组织已经建立了人脸识别草案小组,人脸检测算法也是一项征集的内容。

此外,随着人脸检测研究的深入,国际上发表的有关论文数量也大幅度增长,如IEEE的FG、ICIP、CVPR等重要的国际会议上每年都有大量的关于人脸检测的论文,占有关人脸研究论文的1/3之多。

整体来看,人脸检测研究涉及计算机视觉、数字图像处理、人工智能等多个学科领域,同时这项研究还满足了现代计算机网络和通信系统高速发展的需求,无论从实用性还是从学术性来看,均具有很高的研究价值。

随着计算机网络的普及,图像、视频等多媒体信息在计算机信息中比重的加大,这一研究必然会得到更快、更长远的发展。

1.3人脸检测算法的总体框架

通常来说人脸检测一般按照“分割—检测”的模式,将基于肤色模型的区域分割与基于模板匹配的人脸检测综合起来。

1、基于肤色模型的区域分割

区域是一个彼此互相连通的具有一致意义属性的像素集合,是一种方便的图像中层符号描述,是目标模型化以及高层理解的基础。

区域分割是图像分析和理解的一项基本内容,其过程可以概括为按照选定的一致性属性准则,将图像划分为互补交叠的区域集的过程。

目前国内外很多专家学者对肤色分割做了大量的研究,基于肤色模型的分割方法大多采用RGB颜色空间、YCbCr颜色空间、HSV颜色空间等。

在不同颜色空间中的肤色分割各有其优缺点:

BGB颜色空间得到的结果将非肤色区域(尤其是偏红的部分)分割出来了,但是一般没有漏检;

在HSV颜色空间结果非肤色区域分割的较准确,但是肤色区域分割效果不完全;

YCbCr颜色空间的结果将亮度分量与色度分量分离,较好地去掉了肤色发红的部分。

2、基于模板匹配的人脸检测

在分割出的肤色区域中,使用平均双眼和平均人脸模板匹配加人工神经网验证的方法,在一定尺度范围内进行穷举搜索,精确定位出人脸,其中为了减少错误报警,使用了双神经网仲裁方法。

算法以大量样本为统计数据,分别建立肤色模型、构造平均人脸模板和训练人工神经网。

具体而言,首先建立了训练用的图像库,手工的方法裁剪出人脸的肤色区域,用于研究肤色的分布;

其次用手工标定的方法切割出人脸的五官区域,转换为灰度图像后进行尺度和灰度分布标准化,其中一小部分用于构早平均人脸模板,其他作为训练人工神经网的人脸样本。

通常采用改进的自举方法,用模板匹配加神经网的再训练。

概括地说,我们的方法是基于样本的机器学习方法,具有较强的鲁棒性,而且通过适当地增加样本容量可以进一步提高检测性能,具有较好的可扩展性。

人脸图像所包含的模式特征十分丰富,这些特征中哪些是最有用的、如何利用这些特征,是人脸检测要研究的一个关键问题。

人脸模式具有复杂而细致的变化,因此需要采用多种模式相结合的方法。

归纳起来,根据利用特征的色彩属性可以将人脸检测方法分为基于灰度特征的方法和基于肤色特征的方法两类,前者利用了人脸区别于其他物体的更为本质的特征,是人脸检测领域研究的重点,后者适用于构造快速的人脸检测和人脸跟踪算法,也是本文将要研究的内容。

1.4人脸检测的一般方法

1.4.1基于灰度特征的人脸检测

1.基于特征的人脸检测方法

基于特征的人脸检测方法是通过检测出不同的人脸面部特征的位置,然后根据他们之间的空间几何关系来定位人脸。

这种方法又可进一步分为基于知识和基于局部特征的检测策略。

基于知识的方法首先定位候选人脸区域,然后再通过人脸的先验知识来检验人脸是否存在。

与之相对应的基于局部特征的方法中,人脸的局部特征如眼睛、鼻子和嘴唇等首先被检测出来,然后由这些局部特征组合成人脸。

基于知识的方法是利用对人脸的先验知识导出的规则来进行人脸检测的。

人脸局部特征的分布存在着一定规律,例如,人的两个眼睛总是对称分布在人脸的上半部分,鼻子和嘴唇中心点的连线基本与两眼之间的连线垂直等,于是我们可以利用一组描述人脸的局部特征分布的规则来进行人脸检测。

基于知识的方法中所用到的规则可以表述为人脸局部特征之间的相对距离和位置关系等,当满足这些规则的图像区域被找到后,则认为一副人脸已被检测出来,然后可以对候选的人脸区域进行进一步的验证,以确定候选区域中是否包含人脸。

Yang和Huang[4]提出的分层次基于知识的方法检测人脸是采用这种方法的例子。

基于局部特征的方法首先在整个图像中搜索一组人脸局部特征,然后通过它们之间的几何关系组合成候选的人脸区域。

由于人脸局部特征的不变性,通过组合人脸的局部特征,可以把应用于检测不同位置、不同角度、不同位姿的人脸。

Chin-chuanHan[5]等提出的先获取眼睛再搜索人脸区域的人脸检测,是该方法的一个实例。

2.基于表象的人脸检测方法

基于表象的人脸检测方法遵循一种统一的模式,即首先通过学习,在大量训练样本的基础上建立一个能对人脸和非人脸样本进行正确识别的分类器,然后对被检测图像进行全局扫描,用分类器检测扫描到的图像是否包含人脸,若有,则给出人脸的位置。

采用这种检测模式的理论依据是:

人脸具有统一的结构模式(都是由眉毛、眼睛、鼻子和嘴唇等人脸器官构成),如果把所有的图像集看作一个高维线性空间,那么整个人脸图像仅对应于其中的某个子空间。

于是,可以通过检验待测图像是否落在这个子空间中来判断其是否为人脸。

因此,可以通过大量的人脸和非人脸样本来建立一个分类器,使它能够正确地分辨这两种不同的图像模式,再利用训练好的分类器在未知的图像中检测人脸。

采用这种检测策略的关键在于如何选取大量的具有代表性的图像样本,特别是非人脸图像样本,来训练分类器。

具体分类器的实现可以采用不同的策略,如采用神经网络的方法和传统的统计方法等。

采用这种方法进行人脸检测的例子有:

Sung和Poggio[6]提出的基于样本学习的人脸检测方法;

TurkPentland[7]提出的基于主成分分析的人脸检测方法;

Rowly[8]等实现的基于神经网络的方法等。

3.基于模板匹配的人脸检测方法

基于模板匹配的方法一般是人为地预先定义一个标准人脸模板,可以是包含局部人脸特征的子模板。

然后对一副图像进行全局搜索,对应不同尺度大小的图像窗口,计算与标准人脸模板中不同部分的相关系数,通过预先设置的阈值来判断该图像窗口中是否包含人脸。

以上每一种基于灰度特征的人脸检测方法都有各自的优缺点。

基于特征的人脸检测方法规则不易设计,因规则制定的过高或过低会造成漏检或误检,而且当图像背景中存在灰度类似人脸的区域时,必然会导致误检,故识别率不高。

基于表象的人脸检测方法,一般只能在图像中检测垂直正面的人脸,用于建立人脸模型和训练神经网络的样本数量太大,进行全局搜索的时间较长。

基于模板匹配的方法,计算时间开销相当大,因固定模板无法调整,不适用于姿态、表情变化时的人脸检测,弹性模板虽然可调,但对图像进行全局搜索时,要动态地调整参数和计算能量函数,计算时间开销也很大。

1.4.2基于肤色特征的人脸检测

肤色是人脸的重要信息,不依赖与面部细节特征的变化而变化,对于旋转、表情变化等情况都能适用,具有相对的稳定性,并且和大多数背景物体的颜色相区别。

因此,肤色特征在人脸检测中是最常用的一种特征。

肤色特征主要由肤色模型来描述,肤色模型的建立是利用肤色特征进行人脸检测的首要条件,肤色模型是否合适直接影响人脸检测准确率,使用何种形式的肤色模型与颜色空间的选择密切相关。

人脸检测常用的颜色空间主要有RGB、YCbCr、HSV、HSI等颜色空间。

肤色模型一般采用实验的方法,通过大量“肤色”与“非肤色”像素在相应颜色空间中的聚类特性分析来建立。

不过,由于人脸颜色与某些其它物体的颜色相同,所以单纯利用肤色特征进行人脸检测是很不可靠的,实际应用中一般多是结合肤色特征与其他特征来检测人脸。

目前关于人脸检测的研究已开始向综合特征发展。

如基于模板匹配和支持向量机的人脸检测,基于离散隐马尔可夫模型和奇异值特征的人脸检测,基于小波变换和支持向量机的人脸检测等等。

大部分彩色图像的人脸检测,都利用了肤色特征和灰度特征的综合,如基于肤色和模板的人脸检测,基于肤色和主元分析的人脸检测,基于颜色和形状的人脸检测等等。

很多综合模型在理论上是很完美的,但从某些实际应用而言,有些特征的综合并不适合,不但算法过于复杂,计算时间过长,而且随着使用多个特征而引起的条件的增加,漏检率显著上升,从而不能应用于多数场合。

所以,选择何种形式的检测方法,在实际操作中要统筹兼顾。

1.5论文的结构安排

本论文共分五章,具体安排如下:

第一章,人脸检测综述,简要介绍了人脸检测技术产生的背景、意义以及国内外发展现状,系统分析了人脸检测的基本框架和主要方法;

第二章,算法理论与实现原理,详细介绍了肤色检测中最重要的理论基础以及实现的原理;

第三章,基于统计的肤色建模,通过对大量的样本训练,得到肤色在不同空间中的模型;

第四章,人脸检测实验仿真及结果,不同的肤色模型下仿真出的实验结果,并对每一种结果做了简要分析;

第五章,结论及展望,总结了全文的内容并对需要进一步研究的问题进行了展望。

第二章算法理论与实现原理

对于有关彩色视觉系统的设计开发而言,研究颜色是相当重要的。

图像中的颜色不仅给我们的感觉更愉悦,而且能获得更多的视觉信息。

人的视觉对彩色性当敏感,人眼一般能区分的灰度等级只有二十多个,但是能区分有不同色度和亮度的几千种颜色。

可以察觉的颜色属性包括色调、饱和度和亮度:

色调指红色、绿色、蓝色等颜色,对单色光源而言,色调的不同以波长的不同显示;

饱和度是可以察觉的白色光加入单色光的比;

亮度反映了察觉的明视度。

在数字图像中利用彩色信息可以提高图像的可鉴别性,使图像更容易辨认,目标更容易识别。

在进行数字图像处理时,人们并不是对所有颜色一一处理,而是根据色度学理论建立颜色模型,基于颜色模型进行处理。

色度学理论认为,任何颜色都可以由红(R)、绿(G)、蓝(B)三种基本颜色按不同的比例混合得到。

2.1颜色空间

根据计算机色彩理论,对每一种颜色而言,在计算机中有不同的表达方式,这样就形成了各种不同的色彩系统,即颜色空间。

当然,各种颜色空间只不过是颜色在计算机中不同的表达而已,每一种颜色空间都有各自的产生背景、应用领域等。

主要的颜色空间有RGB、YCbCr、HSV等。

其中,RGB颜色系统是最基本的颜色系统,其他的颜色系统都是基于该颜色系统的,只是用途各异,它们与RGB颜色系统可以按一定的关系相互转换。

2.1.1RGB颜色空间

RGB颜色空间用R、G、B三种基本颜色分量来标示数字图像像素的颜色值。

我们非常熟悉的计算机屏幕的显示通常采用RGB色彩系统,这是最常见的色彩系统。

可以用三维的笛卡尔坐标系统来表示RGB颜色空间,如图2-1所示,RGB颜色空间中三维空间的三个轴分别与红、绿、蓝三基色相对应,原点对应于黑色,离原点最远的顶点对应于白色,其他颜色落在三维空间中由红、绿、蓝三基色组成的彩色立方体中。

图2-1RGB颜色空间模型

将RGB颜色空间模型归一化处理的计算公式为:

r=

g=

b=

2.1.2YCbCr颜色空间

YCbCr彩色模型是一种彩色传输模型,主要用于彩色电视信号传输标准方面,被广泛的应用在电视的色彩显示等领域中。

YCbCr其中Y是指亮度分量,Cb指蓝色色度分量,而Cr指红色色度分量。

人的肉眼对视频的Y分量更敏感,因此在通过对色度分量进行子采样来减少色度分量后,肉眼将察觉不到的图像质量的变化。

其中,Cr反映了RGB输入信号红色部分与RGB信号亮度值之间的差异,而Cb反映的是RGB输入信号蓝色部分与RGB信号亮度值之同的差异。

它将亮度型号与色度信号分离,非常适用于肤色检测。

具体来说YCbCr颜色空间模型具有如下的优点:

(1)YCbCr色彩格式具有与人类视觉感知过程相类似的构成原理。

(2)YCbCr色彩格式将色彩中色度分量Cb、Cr与亮度分量Y有效地分离。

(3)Y,Cb,Cr,可以由R,G,B经过线性变换得到,计算效率较高。

(4)在YcbCr空间中肤色聚类特性比较好。

它与RGB颜色空间的具体转换关系如下:

RGB颜色空间向YCbCr颜色空间转换的公式:

公式一

YCbCr颜色空间向RGB颜色空间转换的公式:

公式二

2.1.3HSV颜色空间

在许多实用系统中,大量应用的是HSV模型,这个模型是由色调(H)、饱和度(S)和亮度(V)三个分量组成的,与人的视觉特性比较接近。

HSV使用单六角锥的颜色模型,如图2-2所示, HSV模型的三维表示从RGB立方体演化而来。

H参数表示色彩信息,即所处的光谱颜色的位置,该参数用角度量来表示,红、绿、蓝分别相隔120度,互补色分别相差180度。

纯度S为比例值,它表示成所选颜色的纯度和该颜色最大的纯度之间的比率。

V表示色彩的明亮程度,它和光强度之间没有直接的联系。

该模型的重要性在于:

一方面消除了亮度成分V在图像中与颜色信息的联系,另一方面色调H和饱和度S与人的视觉感受密切相关。

基于人的视觉系统颜色特性使HSV模型成为一个研究图像处理的重要工具。

图2-2HSV颜色空间模型

RGB颜色空间向HSV颜色空间转换的公式:

V=max(R,G,B)

S=

公式三

H=h

公式三中:

mm=max(r,g,b)-min(r,g,b),

h=5+b

若r=max(r,g,b)和g=min(r,g,b)时,

h=1-g

若r=max(r,g,b)和g

min(r,g,b)时,

h=1+r

若g=max(r,g,b)和b=min(r,g,b)时,

h=3-b

若g=max(r,g,b)和b

h=5-r

若是其他情况时,

HSV颜色空间向RGB颜色空间转换的公式:

公式四

2.2常见的肤色模型

肤色模型是关于肤色知识的计算机表示。

通过训练样本集建立肤色模型是肤色检测的关键,常用的肤色模型有单峰高斯模型、混合高斯模型和直方图模型。

Terrillion等考察了归一化的rgb、CIElab、归一化了的TSL、CIE-DSH、HSV、YIQ、YES、CIEluv和DIE-xy九种色度空间,比较了单峰高斯模型和混合高斯模型在不同色度空间中的性能,发现除了少数情况外,一般需要使用混合高斯模型才能较好地描述肤色区域的分布。

Terrillion等同时还指出,最终限值监测性能的因素是不同色度空间中肤色与非肤色区域的重叠程度。

Jones等研究了RGB空间中肤色与非肤色像素的分布,根据标定出肤色区域的近二万副图片(包含约二十亿个像素)建立了三维直方图,在此基础上比较了直方图模型和混合高斯模型,发现前者的性能略好于后者。

除了上述三种肤色模型外,还有直接利用几何参数描述肤色区域分布范围的模型、三维投影模型、基于神经网的肤色模型等。

此外也有同事考虑肤色与非肤色像素分布的基于贝叶斯方法的模型。

2.2.1区域模型

该模型又称简单门限模型、IF-THEN模型,它主要是利用了肤色在颜色空间中的聚类性,用数学表达式明确规定肤色的范围,在这个范围内的区域被标定为肤色区域,范围之外的区域被标定位非肤色区域。

利用这个模型来判段肤色主要需要两个步骤:

首先通过统计的方法确定模型,即归确定肤色的具体范围;

其次利用这个模型来判段新的像素或区域是否为肤色。

因此,对于一幅新的图像,如果某个像素或区域满足给定的条件就为肤色像素或区域,否则就是非肤色像素或区域。

从它的判断过程来看,这是一种较简单的肤色模型。

该模型的难点在于如何精确地确定阈值,阈值选择不当可能会使肤色检测率下降,误检率上升。

此模型相对简单,计算快捷,使用方便,速度快,但效果不是很好,只适用于特定条件下的肤色检测。

2.2.2高斯分布模型

高斯密度函数估计是一种参数化的建模方法,可以分为单峰高斯模型和混合高斯模型。

1、单峰高斯模型

这种方法的前提是假设肤色分布服从单峰高斯分布。

主要通过统计分析,来预测单峰高斯分布中的参数,其中确定参数常用的方法有EM算法、Maximum-Likelihood或通过统计直接求得色彩空间中每一个分量(一般利用该颜色空间中的色度分量)的均值与方差。

这种方法也可分为两个步骤:

首先确定模型的参数,即确定均值和方差;

其次利用该模型判段待检像素或区域是否为肤色像素或区域。

单峰高斯模型相对区域模型来说能更好的表示肤色的分布,因此它的肤色检测率也较高,并且模型的参数也易于计算,但是速度较区域模型慢。

单峰高斯模型是椭圆高斯联合概率密度函数:

其中x是像素的颜色分量,

是均值向量,

是协方差矩阵。

高斯分布参数

用最大似然法估算。

x属于肤色的可能性可以直接用P(x/skin)来衡量,也可以通过高斯分布参数来计算像素x与均值

的马氏距离

距离大小表示该像素与肤色模型的接近程度。

2、混合高斯模型

由于单峰高斯分布具有其局限性,不同种族的肤色直方图并不完全满足单峰高斯分布,却可以采用多峰的高斯分布来精确表示,因此提出了混合高斯模型。

混合高斯模型是多个高斯密度函数的加权和:

其中x是像素的颜色向量,k是高斯密度函数的个数,分别用均值向量

和协方差矩阵

来定义,权值

表示各个高斯密度函数对混合高斯模型贡献的大小。

该模型表明肤色的每个像素密度都属于概率密度这个混合体。

这个模型的主要难点是对混合高斯模型的参数估计,其参数的估计通常采用Dempster等人提出的基于极大似然值的算法。

这种模型相对于前面两种模型来说,肤色检测率要高得多,误检率也小得多,但是模型的确定(模型的参数估计)较难,速度较慢,不适用于快速肤色检测。

高斯肤色模型常用二维色度平面来表示肤色的分布,色度平面中的肤色分布是否符合高斯分布决定此建模方法的好坏,研究表明这种分布形态与所选的颜色空间密切相关。

Yang(15)验证了在RGB颜色空间中,一定光照变化范围内的肤色符合高斯正态分布;

Yang(33)证明了在Luv颜色空间中,肤色呈现正态分布。

如果肤色在某个颜色空间中的分布非常不对称,则会造成相同正检率条件下误检率升高。

2.2.3直方图模型

直方图肤色模型是一种非参数化的模型,通过对肤色直方图的统计,然后利用阈值来进行判别。

肤色样本的统计直方图可以构造肤色概率图,即为离散化的颜色空间中的每个格子赋予一个概率值。

利用肤色概率图来检测肤色像素主要有两种方法:

贝叶斯分类器和规则化查表法。

对于三维直方图,尽管效果很好,但是需要很多的训练样本而且训练时间很长,比较复杂,本文不详细讨论这种方法。

2.3区域分割理论

利用肤色模型对肤色进行分割主要分为两个阶段:

模型建立和模型运用。

模型的建立主要是通过对样本库中的大量纯肤色图像进行肤色像素的聚类分析,然后确定模型中的参数;

模型的运用,主要是通过已建立的肤色模型来判段所输入的像素或区域是否属于肤色像素或区域,或者给出其与肤色的相似度。

2.3.1区域分割

由于自然界中存在大量与人类皮

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 法律文书 > 调解书

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1