人脸检测与几何面归一化译文.docx
《人脸检测与几何面归一化译文.docx》由会员分享,可在线阅读,更多相关《人脸检测与几何面归一化译文.docx(13页珍藏版)》请在冰豆网上搜索。
人脸检测与几何面归一化译文
人脸检测与几何面归一化
作者:
K.T.Talele
电子工程系
萨达尔?
帕特尔研究所的技术
印度孟买400058
电子邮件:
*****************.uk
SunilKadam
电子工程系
萨达尔·帕特尔大学工程
(UnaidedWing),孟买,印度400058
电子邮件:
sunil.kadam@
摘要:
人脸检测是人脸识别的前提步骤,包括相关的应用程序识别和面部分析。
面对目的检测系统,要识别和定位所有的面孔,无论他们的位置,规模,方向,照明条件,表达式等,在各种条件下检测人脸,会影响人脸的识别率。
各种方法都能检测图像中的面孔,但是,作为人脸检测任务是相当复杂的,每一种方法只是建立一个自己的检索范围。
两个主要的人脸检测方法有:
基于图像的方法、基于几何方法。
我们将集中于一个探测器处理图像速度非常快,同时实现高检出率的方法。
这种检测是基于对提高算法,被称为AdaBoost和简单的Haar(哈尔,荷兰语)型功能反应Viola和Jones[1]。
本文提出了一种几何归一化方法的基础,对眼睛检测Haar特征和Adaboost算法。
该方法有效地正常化识别中的平面导向,增进和提高人脸的识别率。
关键词:
人脸检测,人脸的规范化,Adaboost算法,Haar哈尔。
一、导言
人脸检测是在不同的人脸分析的初始步骤应用。
无数的人脸检测方法已经在过去几年被开发出来。
每一种方法都是在特定情况下使用,我们可以群集这些众多的方法。
分为两种主要方法:
基于图像方法和基于特征的方法。
第一种方法使用分类静态如一个给定的例子集。
然后分类通过整幅图像扫描。
另一种方法包括在检测特定的人脸特征,如眼睛,鼻子,等等。
使用人脸检测的两个方法是基于图像和基于特征。
在这个意义上,它采用了基于图像学习算法,精心挑选的分类正面和负面的例子。
它还具有基于地段的特点,选择学习算法直接关系到面的特定功能(眼睛位置,鼻梁的对比)。
是一种提高技术、提高识别率的很好的例子。
学习使用这种方法是对主流人脸检测技术的贡献。
另一方面,用于简单的分类提高,是Haar的类似的功能,它可以实现快速而良好的检测率的计算。
这最快和最强大的人脸检测系统能提高检测速度。
检测速度是取决于功能的简洁和良好的识别率,获得的最根本方法是提高高性能算法的使用,AdaBoost方法是从一个大集选择重要特征。
在384×288像素的工作图像,用传统的700兆赫的英特尔奔腾处理器,检测面部时每三秒能检测15帧图像[1]。
该探测器在不同尺度的窗口对图像有一个不断变化的扫描。
每个子窗口由一个测试分类做几个阶段(级联的概念)。
如果子窗口显然不是一张脸,它会被拒绝的在级联的第一步,如果它是更难识别的内容,将被后续具体的分类(后来在级联)识别。
Adaboost算法的第一个贡献是选择面孔的功能描述。
该检测申请先后的原则,然后给予简单的分类,并结合他们在最后的强分类器。
这些功能能实现基本性能检测。
困难是要找到简单到足以允许快速分类的面孔,即其特征足以区别面孔和非面孔。
获得一个很好的折中,让人联想到Haar的基础功能。
其实功能实现区域无非是两个,三个不同或者四个不同的尺度和形状的矩形区域。
至于改善这些功能的计算时间,我们引入了新形象代表整体形象的方法,它允许四种基本计算操作一个矩形区域,即加法和减法之类。
然后,因为我们的方法有一个大的特点,AdaBoost是选择其中的一小集,以建立一个强大的最终
分类。
我们要保持唯一的功能分隔,找出最明显的正面和负面的样式。
所以在每个选择的第一步,
AdaBoost的提供一个弱分类器(功能)选择一个有效的识别算法和强大的边界泛化功能。
最后,第三个重要的贡献是级联,即实施重点检测关键区域。
因此,它首先迅速消除所在地区没有正面的区域,然后,我们越往下走,在级联过程中,会有更具体的分类,所以最终几乎只有脸部能被检测到。
对于人眼检测,已提出不同的方法[2][3]。
李赣拟议的亮度直方图的方法[2]:
通过眼球定位,使用候选窗口找到眼睛。
但是,确定识别窗口坐标中所有图片都不能正常工作。
二、算法概述
在一些面部分析系统中,直接将人脸图像作为输入。
虽然,在一般的第一步将是人脸检测和位置定位。
在人脸检测步骤中,难度最高的阻碍是由于在光的强度,存在或不存在可识别的结构组件,面部表情,肤色,面积,姿势,形象定位和闭塞等[7]。
对于任何给定的图像,需要在识别进行前进行亮度正常化处理。
亮度正常化的进行,有利于直方图的均衡。
在这里,我们采用的人脸检测方法是基于AdaBoost和级联开发和由Viola使用矩形的Haar特征的算法。
选定haarlike掩码能有效地识别特定面部特征。
在给定一个图像进行检测过程中,将这些面部进行提取。
根据两只眼睛的位置为提取的面孔正面对的方向进行测量。
几何正常化使用的是仿射对象转换的方法。
步骤参与提出的方法所示的流程图(见图1)。
几何正常化之前,我们将概述脸的检测过程,同样也适用于眼睛定位侦测。
图。
1。
建议系统流程图。
三、人脸检测
1.哈尔的特点
人脸模型,特别是难以识别的那些脸部对象,主要是由于他们在各种颜色和质地的区别,并没有背景上的限制。
在与存在的脸相比,我们使用的是应用程序的建模方法和要求,我们获得一个结论,基于特征的方法将更为合适,而不是基于像素的方法。
有许多使用功能(让人联想到一些Haar基础的动机比像素更加直接的功能)。
最常见的原因是,功能可以充当编码点对点,难以处理使用数量有限的数据。
正如我们会看到,这些功能的运行速度远远超过像素系统的能力。
这些功能是为那些由Papageorgiou使用的方法[4]。
Haar小波是一种天然的整套基础功能,能计算相邻地区的差异强度。
2.矩形Haar特征
在指定的人脸检测系统,只使用到了简单的功能。
我们使用了的让人联想到哈尔的基础——小波
功能。
相应的Haar小波是:
有3种Haar的功能。
一种是在两个矩形区域的像素中两个矩形功能的总和之间的差额。
区别有矩形的大小,形状和水平或垂直相邻(见图2)。
一种是三矩形特征计算的总和,减去在外面的两个矩形内中心的矩形。
最后一种,是基于矩形的对角线,对四个矩形进行差异特征计算。
鉴于探测器的基本分辨率为24×24,详尽的一套矩形的识别功能是相当大的:
180,000。
请注意,在Haar的基础上,矩形的功能集是超出范围的。
图2。
例如矩形特征表现出相对封闭的检测窗口。
躺在白色矩形内的像素的总和减去在灰色矩形的像素的总和。
两个矩形(A)和(B)所示功能。
图(c)显示了三个矩形的功能,及(D)四个矩形特征。
四、整体形象
我们现在知道,我们需要Haar的样的功能进行分类。
这一部分的目标是引进一个新的形象,代表调用整体形象产生一个快速的特征计算。
这一表示形式,是在关系密切的总和面积图形中表示出来的[5]。
坐标(X,Y),表示整体形象的是所有离开(X,Y)像素的上方的面积总和,其中包括这一点上,如图3所示。
图。
3。
整体形象的表示形式。
整体形象即(X,Y)点上方和左侧的所有像素(X,Y)的总和。
公式
(2)是初始图像I和II(X,Y)的整体位于点值(X,Y)的整体形象。
我们可以定义整体形象
(2):
使用这种表示形式的主要优点是,任何在原始图像中的矩形的总和,可以分别在四个有整体形象的数组中引用。
它们之间的差异由两个矩形的总和被八次计算。
因此,计算特征,是只有一个,两个,三个或四个不同长方形的款项。
两个矩形特征分别被引用6次,因为两个矩形相邻。
三矩形特征需要8次引用,四个矩形数组只有九次引用。
五,研究Adaboost的
考虑一个特征分类和一套功能,我们可以建立人脸检测,通过运用所有的面部,在每个图像的位置(每次移位,每个规模)进行识别。
对于此可用于许多不同的识别方法。
此外,我们有一个包含18万特征的整套基础分辨率24×24的探测器,这是远远大于像素数的,因此,即使响应的功能是非常简单的运算(特别是与整体形象代表),就应用所有功能集未免太浪费昂贵的时间。
在下一阶段的脸部识别探测器的建设中,要积极使用选择功能,选择一个实惠的功能的设置:
最好尽快的分离负面的模型。
产生最后的分类,将是一个Haar类似的功能简单的线性组合。
对于这个调用AdaBoost的算法的系统(自适应促进)(见图4),其中有两个主要目标:
选择几集的功能,即代表可能的面部,还有强大的最终分类器的线性组合,从而最好地实现这些功能。
图4。
对AdaBoost的基本计划
AdaBoost的是一个有效的Boosting算法,结合简单的统计,同时显著降低了识别的错误,同时也纠正了更难以捉摸的泛化错误。
六。
级联分类
AdaBoost的选择提供的一组包含18万特征的小的功能集。
初步实验表明,从200特征构建的正面人脸分类产生检出率95%,假阳性率14084[1]。
这些结果是令人满意的,但不足够应付许多真实世界的任务。
而且,我们需要大大减少计算时间。
为了实现这一目标的我们应该使用可以进一步取得更好集中识别的联检测性能。
这是可能的,以尽量减少数量的假阴性,而不是一直有的识别的错误,这正是用于建立这个级联的主要思想。
与Adaboost的选择初始矩形特征差距比较大的检测子窗口,即识别不易识别的脸的大小和位置,可以通过级联,建造更小、更高效、更简单的分类,其中还包括用于剔除负面窗口的分类,从而实现更复杂的分类,帮助我们减少假阳性率。
在检测过程中的整体形式是——退化决策树。
图5显示了这个级联的过程。
图。
5。
级联检测原理说明。
一系列的分类精确到每个子窗口。
消除了大量的初步分类,很少出现处理的负面。
随后层消除额外的干扰,但需要额外的计算。
经过几个阶段的加工,子窗口的数量已经从根本上减少。
最后归类为对我们有利的数据明显增多。
任何单一的图像内的大部分子数据都是负面数据。
级联结构,如果要试图拒绝负面数据,应尽可能在最早阶段就进行否定。
如果一个子窗口划分为一个阶段,它的收益最早将在级联的下一阶段进行评估。
直到这个子窗口认定这是一个阶段,或发现所有的负面数据都已经清除。
在最后这种情况下的它会终于被视为一个对我们有利的数据。
A.培训级联分类器
级联实现过程中涉及到两种类型的取平衡。
在大多数情况下,与更多的功能分类可实现更高的检测率和低误报率。
在同时进行非常多的功能分类,需要更多的时间进行计算。
级联结构有三个主要参数,我们必须确定:
总数,分类k和每个阶段的i,门槛的Thetai,多项功能的NI。
在实践中,目标设置为最大限度减少误报和最大降幅减少浪费。
每加入一个参数,直到目标检测功能和训练阶段数据正确率得到满足,才能进行下一步。
添加阶段,直至整体数据有效性检出率的目标得到满足才行。
七。
几何正常化
我们必须使用2D基本交换律。
2D基本矩阵形式变换(反时针方向)公式是:
(X,Y)对应像素的原始位置,图像的(X',Y')对应的旋转后的图像的像素位置。
二维的基本旋转变换矩阵旋转原点的对象有关。
在提出的方法中,我们必须旋转有关面对顶点的点的图像。
因此,我们必须执行三个步骤来旋转关于顶点的点的图像。
因为,我们没有任何2D关于支点的基本旋转变换。
为此,我们需要使用二维基本平移变换。
二维基本平移变换矩阵形式:
其中,tx和ty是沿x轴平移参数和Y轴的方向。
三个步骤的实施的解释如下:
首先包括翻译支点原点,然后旋转的对象和翻译的顶点指向原来的位置。
考虑对象ABC即有一个支点点P(XC,YC)。
图7(a)显示在初始的对象位置。
图。
6。
人脸检测系统的输出。
图。
7。
对象转换步骤。
现在,我们首先计算出P到原点的和的相应变换矩阵是:
换算的对象在fig7(B)可以看出。
换算后,我们旋转一个角度逆时针对象?
(顺时针旋转替换?
获得通过(?
))。
相应的旋转变换矩阵是:
可以看出在fig7(C)对象的旋转。
到了最后,再次的我们变换支点到原来的位置。
关于支点的对象的旋转可以看出,在fig7(D)。
复合变换矩阵所得为:
要旋转任何支点对象,我们需要乘以对象的坐标变换矩阵TM。
(一)测试图像
(二)顺时针旋转图像
(三)测试图像
(四)逆时针旋转图像
图。
8。
面对正常化的测试图像输出
八。
人脸正常化
人脸检测步骤后,必须提取他们。
提取的面部扫描人眼检测。
然后进行眼睛周围的人眼检测,圆的中心点分别位于瞳孔。
给这些点加入线段(长)。
然后通过L的中点绘制一条水平线(L“)与之相交。
然后,我们得到这两者之间的角度?
。
在这里,我们再运用旋转变换矩阵方程9以XC=128YC=128为每一个输入像素统筹的价值。
我们有测试图像调整大小为256×256。
九。
识别结果
系统已经进行测试图像的试验。
这些面部图像识别包括各种条件:
光照,规模,构成。
图(9)和(10)给出了实验测试图像输出。
数字。
9
(一),9(b)及9(c)显示测试图像及预处理后的图像。
图9(c)是一个直方图。
人脸检测器的输出显示在图9(d)。
执行几何正常化所需的步骤,见过程中显示的数字(10)。
图10(a)所示提取的面孔。
眼睛和眼球检测分别由显示图10(b)和10(c)表示。
经过变换矩阵的应用检测人脸,我们得到的归一面由figure.10(D)所示。
为了验证人的的识别率的提高,面部的几何正常化后,我们还进行的人脸识别实验。
对于这一点,我们有表示出来ORL人脸数据库。
表示出来的人脸的算法识别是基于轮廓匹配[8]。
我们完成了对原始图像的人脸识别ORL人脸库,以及对后续图像应用正常化的操作。
用于测试图片
的实验者由100人中取出23人,每个人取出3至5幅图像用于测试。
十,结论
在本文中,我们已经提出了基于Haar特征和Adaboost的算法。
算法有效实现所需的检测。
使用Haar特征和Adaboost人脸检测和人眼检测任务,可用于实时人脸识别应用。
人脸识别实验也验证了几何归一化图像大大提高了人脸的识别率。
(一)输入影像测试
(二)灰度图像
(三)直方图均衡的图像
(四)检测人脸
图9。
人脸检测测试图像输出
(一)提取的面孔
(二)人眼检测
(三)眼球位置
(四)恢复人脸
图。
10。
检测人脸面对正常化输出
参考书目:
[1]P.ViolaandM.Jones“快速目标检测使用的升压级联简单的功能”,计算机视觉与模式识别,
2001年。
[2]GanhuaLi,XaunpingCai,XianshuaiLi,YunhuiLiu,,“一种高效工作面基于眼睛检测的规范化算法”
2006的IEEE/RSJ智能机器人,国际会议和系统,2006的10月9-15的,北京,中国。
[3]王琼,杨靖宇,眼睛在人脸图像检测不受约束的背景下,模式识别研究杂志
55-62页,2006年。
[4]C.Papageorgiou,M.奥伦,和T.Poggio,“一个总体框架检测对象”,计算机视觉国际会议,
1998年。
[5]F.Crow“,总结,区纹理映射表”的法律程序的SIGGRAPH,第一卷。
18(3),第207-212的,1984。
[6]莱纳Lienhart和Maydt约亨,“扩展集Haar样快速检测对象”,英特尔实验室,英特尔公司,圣克拉拉,CA95052,USA。
[7]杨明煊,大卫J.Kriegman,纳伦德拉阿胡加,“检测图片在的面孔:
调查“IEEE模式分析
机器智能,第一卷。
24。
2002年1月1日。
[8]S.T.gandhe,K.T.talele,A.G.凯斯卡,“人脸识别轮廓匹配,“计算机科学IAENG国际杂志。