基于几何特征算法的人眼定位研究与实现.docx
《基于几何特征算法的人眼定位研究与实现.docx》由会员分享,可在线阅读,更多相关《基于几何特征算法的人眼定位研究与实现.docx(39页珍藏版)》请在冰豆网上搜索。
基于几何特征算法的人眼定位研究与实现
本科生毕业设计
论文题目
:
基于几何特征算法的人眼定位研究与实现
姓名
:
柏植
学号
:
201120120231
班级
:
1121202
年级
:
2011级
专业
:
测控技术与仪器
学院
:
核工程与地球物理学院
指导教师
:
方江雄(讲师)
完成时间
:
2015年06月
作者声明
本人以信誉郑重声明:
所呈交的学位毕业设计(论文),是本人在指导教师指导下由本人独立撰写完成的,没有剽窃、抄袭、造假等违反道德、学术规范和其他侵权行为。
文中引用他人的文献、数据、图件、资料均已明确标注出,不包含他人成果及为获得东华理工大学或其他教育机构的学位或证书而使用过的材料。
对本设计(论文)的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。
本毕业设计(论文)引起的法律结果完全由本人承担。
本毕业设计(论文)成果归东华理工大学所有。
特此声明。
毕业设计(论文)作者(签字):
签字日期:
年月日
本人声明:
该学位论文是本人指导学生完成的研究成果,已经审阅过论文的全部内容,并能够保证题目、关键词、摘要部分中英文内容的一致性和准确性。
学位论文指导教师签名:
年月日
基于几何特征算法的人眼定位研究与实现
柏植
Basedontheresearchandimplementationofeyelocationgeometricfeaturealgorithm
BaiZhi
2015年6月
摘要
人眼定位的算法研究一直是算法的热门研究。
人眼是人面部最主要的生物特征之一,但是又由于人眼的多变性和成像过程中容易受多种因素的影响,又使得人眼定位于识别这个研究工作变得及具有挑战性与钻研性。
所以本论文运用了人眼睛几何位置的特征算法来实现对人眼睛的定位,指出了以前若干种人眼定位算法的不足,也充分说明本算法的可行性,本文主要对人眼定位的几种算法进行深入的研究和比较。
本文致力于解决以上问题,其主要贡献有以下几个方面:
1.多种人眼的定位的研究是根据人眼周围梯度的相近性来确定人眼,然这种方法很容易受环境影响,且定位成功的概率不是很大,本文主要是根据人眼睛周围的灰度值是人面部最小的方法来确定可能的人眼存在区域,大大提高了定位成功的概率。
2.人眼定位最基本的方法就是几何定位,传统的方法是全面扫描人脸,进而获取面部特征,这种方法需要大量的检测时间,且增加机器负担。
本文主要利用了质心法的方法来定位人眼睛,大大节省定位时间,简单、快速,适于推广。
3.最终定位的人眼区域用特定颜色标注,便于观察统计识别的情况。
关键字:
识别人脸;人眼定位;特征提取;梯度;质心法
ABSTRACT
Studyonthealgorithmofeyelocationhasbeenahotresearchofthealgorithm.Thehumaneyeisoneofthepeoplefacethemainbiologicalcharacteristics,butalsoduetothevariabilityofhumaneyesandimagingprocesseasilyaffectedbymanyfactors,andmakeseyelocationinidentifyingtheresearchworkandchallenginganddelveinto.Sothispaperusetheeyepositiongeometrycharacteristicofthealgorithmtolocatetheeyestotheperson,pointsouttheshortagesofseveralkindsofeyelocationalgorithmbefore,andthefeasibilityofthisalgorithm,thispapermainlydiscussesthealgorithmofeyelocationin-depthstudyandcomparison.
Thispaperiscommittedtosolvethefollowingproblems,itsmaincontributionhasthefollowingseveralaspects:
1.Thestudyofthehumaneyelocalizationbasedongradientaroundtheeyeclosetodeterminethehumaneye,butthismethodcaneasilyinfluencedbyenvironment,andtheprobabilityofsuccessfulpositioningisnotverybig,thisarticleismainlyaccordingtothepeoplearoundtheeyesofgreyvaluetypefacialminimummethodtodeterminethepossibleexistenceofhumaneyesarea,greatlyimprovingthepositioningtheprobabilityofsuccess.
2.Eyelocationisthemostbasicwayistogeometricpositioning,comprehensivescanthetraditionalwayistoface,andthengetfacialfeatures,thismethodrequiresalotoftestingtime,andincreasetheburdenofmachine.Inthispaper,themethodofusingthequalitativemethodtolocatethepersoneyes,greatlysavesthepositioningtime,simple,rapidandsuitableforpromotion.
3.Thefinalpositioningoftheeyeareawithaspecificcolorcodedtofacilitatetheidentificationofobservationstatistics.Recognizefacesisthemostbasichumanvisualisalsooneofthemostoutstandingability.
Keywords:
Recognizefaces;Eyelocation;Featureextraction;Gradient;Qualitativemethod
第一章绪论
1.1引言
人面部特征识别是基于生物特征识别技术的身份认证中最主要的方法之一。
基于人脸识别的自动身份认证具有重要的意义和应用价值。
早在上个世纪60年代就吸引了有志之士的强烈兴趣,对面部自动机器识别方法的研究已经成为当今图像处理的模式识别和人工智能领域的一个研究热点。
人脸自动识别涉及计算机图形学、计算机视觉、模式识别、机器学习、感知科学、人工智能、计算机智能等技术,经过无数专家学者的潜心研究,人脸识别技术在近年来获得巨大的研究成果,并且正在逐渐走向成熟。
人脸识别相对于其他的识别模式具有直接、友好、方便等多方面的特点,易于被使用者所接受。
人脸识别技术,作为图像分析和理解最成功的应用之一,近年来获得了越来越广泛的关注。
1.2人脸识别与定位研究背景与意义
1.2.1人脸识别的研究的背景
有很多种生物识别方法可以对人的身份进行识别和鉴定,最常见的有指纹识别、声音识别、手型、DNA鉴定等。
但是这些识别技术相对于人脸识别就有着多方面的先天不足,所以人脸识别有以下优点:
(1)自然性,是指该识别方式同人类进行个体识别时所利用的生物特征相同。
而指纹识别、虹膜识别等都不具有自然性,因为人类或者其他生物并不通过此类生物特征区别个体。
(2)隐蔽性较好,利用人脸是被来获取人物的资料信息,这样不会引起他人的注意,而且可以更直观快速的检测到人的资料,不但如此,而且他是利用可见光对人面部的反进而收集人物面部信息,而不同于指纹识别或者虹膜识别,需要利用电子压力传感器采集指纹,或者利用红外线采集虹膜图像,这些特殊的收集人物的信息的方式,有时会使人们感到反感,使人们对此种方法产生怀疑。
(3)个体之间面部的差别虽然不是很大,甚至人脸结构外型都很相似,但是这样的特点对于利用人脸进行定位是有利的。
(4)人脸的不稳定的外型,人可以在不同时刻把自己的喜怒哀乐表现在脸上,导致观察的时候会产生不同程度的误差,另外,人脸识别还受光照条件、人脸的很多遮盖物、年龄等多方面因素的影响。
可知人脸识别有众多优点,所以很有有志之士都在潜心研究。
1.2.2人脸识别研究的意义
人脸识别的应用领域相当广泛,主要有以下几个方面:
(1)公共安全:
公安部门追寻逃犯、罪犯识别等;
(2)信息安全:
计算机和网络的登陆、文件的加密和解答;(3)政府职能:
电子政务、户籍管理、社会福利等;(4)证件鉴别:
身份证、护照、学历证明的真伪鉴别等;(5)家庭娱乐:
智能玩具、体验真实游戏、模拟现实游戏等;(6)商业企业:
电子商务、电子货币和支付、考勤。
所以人脸识别的研究对人类来说就很有研究的意义。
1.3典型的人脸识别系统
下图(图1-1)是一个典型的人脸识别系统的工作流程图:
图1-1典型人脸识别系统工作流程图
系统的各个部分和作用如下:
图像的获取部分主要负责获取图像,图像可以来自于任何图像采集设备,然后经过处理转化成可处理的数字信息。
基本图像处理部分包含了对图像的一些简单的处理,对图像进行了增加亮度和对比度的处理,增加了识别的准确度和减小了错误率,同时也增加了程序对图像边缘的提取的精度,增加了二值化操作的简单性以及图像灰度处理等相关过程。
检测定位部分主要是为了检测图像所示的部分是否有人脸存在,如果有则对人脸进行定位。
输入的图像背景多复杂都不会影响图像的识别。
正规化部分将提取到的图像作大小、灰度的归一化处理,使不同的人脸图像显现出相同的亮度和对比度。
特征提取部分时本软件的重要部分,此部分主要是根据已经二值化的人脸图像根据某种规则来记录人脸的特征。
有的时候人脸的数据量太大,会采取不同的记录方法,比如对人脸数据进行变换。
分类器设计是在后台运行的部分,这部分可以看成是一个分类器,它把待识别的图片归到一类。
这种归类对被识别的对象进行分类所造成的错误识别率最小或者损失最小。
分类决策部分就是利用已经做好的识别,给出最后的识别结果,并作出相应的判断。
1.4国内外的研究现状
1.4.1国内研究现状
国内在模式识别等相关领域的研究不是很超前。
但是近年来,国内很多高等院校和研究机构,如中国科学技术大学、东南大学、清华大学、武汉大学、浙江大学、合肥工业大学等高等院校投入大量的钱力和人力在人脸识别相关工作的研究中,并取得了不错的进展,理论水平已经逐步接近甚至超越国际先进水平。
周志华等通过多视角特征分析获得人脸特征,提出将神经网络集成应用于多视角人脸识别,识别精度得到了大大的提升。
彭进业等提出了贝叶斯人脸识别方法中匹配准则的多个近似表达式的形式,以及一种使用的快速的计算方法;在此基础上提出一种利用两幅人脸图像的小波变换系数差作为模式矢量的贝叶斯人脸识别方法,利用发对称的正交小波变换的微分算子,与单纯的基于图像灰度的方法对比,识别率也得到了不少的提高。
王蕴红等人提出基于奇异值分解和数据融合的人脸鉴别方法,利用ORL人脸数据库进行试验,用每个人的6幅图像作训练,其他4幅作为测试,识别率为90.48%。
荆晓远等对人脸图像作正交小波变换,提出基于先惯性和有效互补分析的多类器组合方法,得到其在不同频带上的4个子图像,然后分类提取奇异值特征。
山世光等提出了基于文理特征分布和变形模型的脸部特征提取方法,解决了可变形末班对参数初始值依赖性强和计算时间长的问题。
2002年11月26日,由中国科学院计算技术研究所等单位承担的国家863计划之一的“面部检测与识别核心技术”通过专家鉴定。
该系统只需0.1s或0.05s既可自动检测到人脸,在一般的PC上完成只需要1s。
1.4.2国外研究现状
不单是中国,国外好多国家也投入了大量的精力研究人脸识别的相关问题,主要有美国,欧洲等国家,著名的研究机构有美国MIT的Medialab,AIlab,C的Human-ComputerInterfaceInstitute,MicrosoftResearch等。
综合相关的资料不难发现,目前国际的人脸识别的研究方向:
(1)基于几何特征的人脸识别方法,主要代表是MIT的Brunelli和Poggio小组,他们采用改进的积分投影法提取出用欧氏距离表征的35维人脸特征矢量用于模式分类;
(2)基于模板匹配的人脸识别方法,主要代表是Harvard大学Smith-Kettlewell眼睛研究中心的Yuille,他采用弹性模板来提取眼睛和嘴巴的轮廓,Chen和Huang则进一步提出用活动轮廓模板提取眉毛、下巴和鼻孔等不确定形状;
(3)MIT媒体实验室的Pentland则提出了基于K-L变换的特征脸的方法;
(4)Cambridge大学的Samaria小组和Georgia技术研究所的Nefian小组提出了基于隐马尔可夫模型的方法;
(5)神经网络识别的方法,如Poggio小组提出的HyperBF神经网络识别方法,英国Sussex大学的Buxton和Howell小组提出的RBF网络识别方法等。
1.5论文的结构安排
本文的组织结构如下:
第二章:
介绍了几种常见的人眼定位和面部特征提取的方法,并作了一定的对比,总结了各自的优缺点,还介绍了本论文算法会用到的一些基础知识,使得论文更加充实。
第三章:
详细介绍了本文实现人眼轮廓定位的算法和算法的原理,实现了人眼轮廓区域的定位。
第四章:
介绍了对人眼轮廓区域进行膨化,并用几何法最终定位了人眼位置。
第五章:
总结本文的主要工作和结论,并且提出了对人眼定位的展望。
第二章人眼检测定位的基本算法和理论
2.1引言
第一章简单介绍了人脸的识别的主要需要研究的内容、人脸识别的优点和研究的难点、人脸识别系统的几个主要步骤以及人脸识别国内外的主要发展情况。
人脸识别的研发的主要目的就是为了人们能够更好的生活,人脸的识别中人眼的定位就是最重要的环节之一,现在已经有很多关于人眼定位的算法被提出,下面就介绍人眼定位的基本算法和理论。
2.2基于可视特征的方法
2.2.1几何特征
虽然人脸的特征看起来各不相同,但是其内在还是存在其普遍的特征的,主要是其五官的分配的相对比例是在一定的比例内的,如下图(图2-1)所示为人脸器官的相对位置。
每张人脸从他的的发际到眉间、眉间到鼻尖、鼻尖到下巴的距离大致相等,称为三庭;从正面看,人脸在双水平连线处最宽。
这表明虽然人的每张脸都不尽相同,但是五官的大体位置是一致的,说明我们可以通过检测图像中图2-1标准人面部图
是否有满足这种关系的子图像来检测图片中是否存在人脸。
2.2.2纹理特征
人脸也有可作为区别其他事物的特殊的纹理性质。
可以运用基于空间的灰度相关的矩阵的参数特征来表示人面部的纹理特征,进行低分辨率的人脸检测。
输入图像首先对图像信息进行一定的处理,然后由SGLD矩阵得到结构化的特征,根据人脸的结构化模型,就可以找到人脸。
模型由一组不等式组成,而人面部就被定义在这些不等式所在的区域。
2.2.3颜色特征
人的皮肤的颜色是外界对该面部的第一获取的信息,是人面部最重要的特征之一
,也是人脸的一种显著的特征,所以利用颜色来检测人脸是很好的研究方向。
目前已经有RGB、HSV、YCrCb、TES等颜色空间被用来描述人脸的肤色。
而且肤色的算法有如下的优点:
第一,允许被跟踪对象自由活动,减少环境对肤色的影响;第二,肤色分割的算法没有使用特殊的脸部特征,因此头部方向和姿态的变化不会影响对于肤色的确定;第三,可以在普通工作站上以帧速率来实现人脸区域分割;但是由于光源的颜色问题以及光源发射的角度对图片的影响不容忽视,因此,通常需要将肤色信息与形状、运动信息等相结合,以便能够在图像序列中定位和跟踪人脸。
2.3基于代数特征的方法
基于代数特征的方法,通常是将图像空间的像素点变换到一个投影空间。
用一定数量的基本图像对人面部特征进行先行线性编码。
把给定的m*n像素的训练样本称为空间域向量。
这个基本的向量被映射到一个优化的子空间。
把子空间向量叫做变化域向量。
此方法的目的就是寻找一种从空间域到变换域之间的一种表示方法,并称这个向量为特征图像。
2.3.1主成分分析(PCA)
主成分分析是多元统计分析中用来分析数据的一种方法。
它可以利用较少数量的特征量对样本图片进行描述以达到降低特征空间维度的方法。
可以用KL展开式对人脸进行描述,这样既可以降低空间维数,又可以抽取人脸的特征,人脸特征投影到子空间,非人脸特征也会如此。
由于人脸特征在投影空间没有本质的变化,而非人脸图像表现的不同,因而可以检测出图像只是否有人脸存在。
在很多情况下,变量之间是有一定的相关联系的,当两个变量之间有相关关系时,可以反应这两个变量有某种程度的重叠。
假设有p个不相同的变量,然后有q个不相关的新变量(q≤p),这时这q个不相关的变量就可以表示p,而且还会最大程度的不损失信息,这就是PCA特征提取,此方法获得了最大数据降维。
设有N个训练样本,每个样本根据其像素灰度组成一个向量
的维数的样本图像M=Width*Height(行像素数*列像素数),由向量构成的样本集为[
,
,…,
],这样本的平均向量为
(1)
平均向量又叫做平均脸,则每个训练样本与平均脸的偏差为
(2)
则样本集的偏差矩阵为D,D的维数为M*N。
D=[
](3)
用式(4)计算样本集的协方差矩阵C,C的维数为M*N。
C=
(4)
C=
(5)
求协方差矩阵C的特征向量
和对应的特征值
。
这些特征向量就是人脸空间的多组向量基,用这些向量基可以来表示任何获取到的人脸图像,且图像重要信息集中于特征值较大的特征向量中,也就是说,即使有些表示特征向量小的数据丢失,也不会很大程度的影响图像的质量。
将特征值从大到小的排列:
≥
≥……≥
≥……≥
;对于某一
,若其过小,则可以忽略其影响,这样主成分构成的变换矩阵为
W=[
],m<也就是说任何的人脸图像都可以投影到上式上,W的维数为m*M,而这是一个基底,任何的人脸图像向其作投影时都会产生一组坐标系数,称之为KL分解系数。
在现实的人脸的识别过程中,对于一个确定的样本人脸x,该确定的样本人脸图像与平均脸之间的偏差y=x
,则y在特征脸空间的投影,可以表示为系数向量z,并用下面的公式表示:
z=
(7)
z就是KL变换的展开系数向量,为m*1维。
所以这样的一个脸部图像就实现了可以用较低的系数向量来表示,从而实现了用低维向量表示原始的人脸部的特征。
下图表述了上述的过程。
2.3.2独立分量分析(ICA)
独立分量分析是一种对多变量数据进行非正交线性坐标变换的方法,坐标轴的方向由可观察到的混合数据的二阶和高阶统计信息确定,变换的目的是使变换后的变量间相互独立。
PCA只考虑了模式的二阶统计量,他的特点就是变换后特征向量是相互无关的;ICA不仅考虑了模式的二阶统计量,而且还分析了模式的高阶统计量,ICA的特点是变换后的独立独立量是独立非正交的,ICA可以更好的表示人脸视图的局部特征。
独立分量分析是于1986年提出的一种统计信号处理技术,它与PCA有一些相似之处,但也有不同之处。
ICA的基本思想是用一组统计独立或者尽量独立的分量对随机变量进行表征。
简单的描述如下:
已知的观测数据为X=(
),
是未知分量,可以表示为S=
X和S的关系为
X=AS
其中,分量
均值为零且相互间统计独立;A是未知的特征矩阵。
S的每一行
表示一个独立分量,矩阵A代表观测数据X在各个独立分量特征轴上的幅值。
为了将ICA应用到人脸识别的领域,可以使用矩阵X=
(t*m维)表示用于学习训练的人脸图像库,假设人脸的图像表示为
=
.首先可以应用不动点算法求解恢复矩阵W(m*n维),使得XW=ASE=U。
这样得到的输出矩阵U=XW就是虽未知的统计独立分量S的估计,然后我们得到U以后,用他的航向量为特征向量构造特征空间,所以每一张人脸图像投影到该空间后,都会得到一组对应的人脸空间向量。
所以选择合适的特征向量,他不但可以减小计算量还能够增强对不同人脸图片的分类能力。
所以在衡量各个特征的分类能力的时,额可以采用类内分散度和类间分散度的比值
,j=1,2,3…m。
定义如下:
类内分散度C
为
C
=
(8)
类间分散度
为
C
=
(9)
其中
。
特征的类内分散度与类间分散度的比率
(10)
将
值由小到大的排列
<
<…<
,取与前K个
对应的
用于人脸识别,达到降维目的。
图2-2ICA抽取特征脸模型
上图(图2-2)就是运用ICA方法抽取人脸特征的模型。
假设原始的样本数据X由未知的相互间统计独立的基图像S和线性的混合矩阵A组成。
然后通过W的转化得到近似于基图像S的图像U。
新的待识别的图像F与U进行下面所示(11)的公式运算,就可以得到用于表征人脸的系数。
(
)=
*(
)(11)
其中,(
)表示U矩阵的伪逆,(
)=
。
2.4基于几何特征的算法
几乎所有的人眼定位的研究员都知道基于几何特征算法的人眼定位的方法是最常用的方法,相关文献认为:
人眼睛周围的颜色的灰度值的梯度值是相近的。
也就是说若可以找到图片中某点周围灰度值相近最多的像素点,那么该点就是眼睛所在的区域,然后用相应的算法把该点标注出来即可。
要用此方法定位人眼区域需要先将真彩图片转换成相应的灰度图像,在matlab函数中可用rgb2gray实现,继而获取相应x、y坐标各自灰度的梯度,算出整体梯度,可用gradient函数实现,然后用imadjust函数来调节灰度图像的亮度,使之更加适合检测定位,继而用im2bw函数来使用阈值变化法把灰度图像转换成二值图像,这样就完成了对图像的预处理。
然后就是此种几何算法的核心部分,根据人的眼睛的为近似圆形的方法,且圆形的半径大小约为9—13个像素点的规律,采用循环程序,以每个点为圆心,不同半径的圆扫描,在圆上最多的边缘点就是眼睛的中心位置,然后用imshow函数来用指定的灰度值显示图像,并用plot函数标注出所定位的区域,继而实现了人眼的定位,流程图(图2-3)如下:
图2-3此种几何特征算法的流程
下面为此种几