人脸识别文档文档格式.docx
《人脸识别文档文档格式.docx》由会员分享,可在线阅读,更多相关《人脸识别文档文档格式.docx(31页珍藏版)》请在冰豆网上搜索。
指纹、虹膜、掌纹等识别技术都需要被识别者的配合,有的识别技术还需要添置复杂昂贵的设备。
人脸识别则可以用已有的照片或是摄像头远距离捕捉图像,无须特殊的采集设备,系统的成本低。
并且自动人脸识别可以在当事人毫无察觉的情况下即完成身份确认识别工作,这对反恐怖活动等有非常重大的意义。
由于人脸识别技术具有如此之多的优势,因此它的应用前景非常广阔,已成为最具潜力的生物特征识别技术之一。
本文将人脸识别技术的各种应用及其特点总结在表1-2中。
表1-2人脸识别技术的应用
人脸识别最初的应用源于公安部门关于罪犯照片的存档管理和刑侦破案。
现在该技术在安全系统、商业领域和日常生活中都有很多应用,主要有以下几类应用:
1.刑侦破案。
当公安部门获得罪犯的照片后,可以利用人脸识别技术,在存储罪犯照片的数据库中找出最相像的人作为嫌疑犯,极大的节省了破案的时间和人力物力。
还有一种应用就是根据目击证人的描述,先由专业人员画出草图,然后用此图到库里去找嫌疑犯。
罪犯数据库往往很大,由几千幅图像组成。
如果这项搜索工作由人工完成,不仅效率低,而且容易出错,因为人在看了上百幅人脸图像后,记忆力会下降,而由计算机来完成则不会出现此问题。
2.证件验证。
身份证、驾驶执照以及其他很多证件上都有照片;
现在这些证件多由人工验证完成。
如果应用人脸识别技术,这项工作就可以交给机计算机完成,从而实现自动化及智能管理。
当前普遍使用的另一类证件是用符号或者条形码标记的,比如信用卡。
这类卡的安全性比较低,可能遗失、被窃取,使用场合(比如自动提款机)的安全性也比较差。
如果在这类卡上加上人脸的特征信息,则会大大改善其安全性能。
3.入口控制。
需要入口控制的范围很广,它可以是重要人物居住的住所、保存重要信息的单位,只要人类觉得安全性比较重要的地点都可以进行入口控制,比较常用的检查手段是核查证件。
人员出入频繁时,保安人员再三检查证件是很麻烦的,而且证件安全性也不高。
在一些保密要求非常严格的部门,除了证件外,已经使用了生物特征识别手段,如指纹识别、掌纹识别、虹膜识别和语音识别等。
人脸识别与这些技术相比,具有直接、方便和友好的特点。
当前计算机系统的安全管理也备受重视,通常使用由字符和数字组成的口令(Password)进行使用者的身份验证,但口令可能被遗忘,或被破解,如果将人脸作为口令,则既方便又安全。
4.视频监控。
在银行、公司、公共场所等处设有24小时的视频监控,如何对视频图像进行筛选分析,就需要用到人脸检测、跟踪和识别技术。
除了以上应用外,人脸识别技术还可以用于视频会议、机器人的智能化研究等方面。
尤其从美国9.11事件后,人的身份识别问题更是提升到了国家安全的角度,如何利用人脸信息迅速确定一个人的身份成了各个国家重点研究的技术。
1.1.2人脸识别技术的难点
虽然人类可以毫不困难地根据人脸来辨别一个人,但是利用计算机进行完全自动的人脸识别,仍存在许多困难。
人脸模式的差异性使得人脸识别成为一个非常困难的问题,表现在以下方面:
1.人脸表情复杂,人脸具有多样的变化能力,人的脸上分布着五十多块面部肌肉,这些肌肉的运动导致不同面部表情的出现,会造成人脸特征的显著改变;
2.人脸随年龄而改变,随着年龄的增长,皱纹的出现和面部肌肉的松弛使得人脸的结构和纹理都将发生改变;
3.人脸有易变化的附加物,例如改变发型,蓄留胡须或者佩戴帽子和眼镜等饰物;
4.人脸特征遮掩,人脸全部、部分遮掩将会造成错误识别;
5.人脸图像的畸变,由于光照、视角、摄取角度不同,可能会造成图像的灰度畸变、角度旋转等,降低了图像质量,增大了识别难度。
所以很难从有限张人脸图像中提取出反映人脸内在的、本质的特征。
另外人脸识别还涉及模式识别、图像处理、计算机视觉、生理学和心理学等学科领域。
这诸多因素使得人脸识别至今仍是一个有待深入研究,极富挑战性的课题。
同时一个成功的、具有商用价值的快速的人脸识别系统将会给社会带来极大的影响。
1.2人脸识别技术的发展与现状
人脸识别的研究可以追溯到20世纪60年代末,最早的研究见于文献。
Bledsoe以人脸特征点的间距、比率等参数为特征,建成了一个半自动的人脸识别系统。
人脸识别的发展大致经过了三个阶段,其中伴随发展了多样的人脸识别技术。
1.2.1人脸识别技术发展的三个阶段
第一阶段一非自动识别阶段:
主要研究如何提取人脸识别所需的特征。
通过简单的语句描述人脸数据库成为待识别人脸设计逼真的摹写来提高面部识别率。
这是需要手工干预的阶段。
此阶段以Bertillon、Allen和Parke为代表。
在Bertillon系统中,用了一个简单的语句与数据库中的某一张脸相联系,同时与指纹识别相结合,提供了一个较强的识别系统。
为了提高面部识别率,Allen为待识别人脸设计了一种有效逼真的摹写,Parke则用计算机实现了这一想法,并且产生了较高质量的人脸灰度图模型。
在此阶段,识别过程全部依赖于操作人员,所以不是一种自动识别的系统。
第二阶段一人机交互阶段:
这一阶段虽然实现了一定的自动化,但还需要操作员的某些先验知识,仍然不是一个完全自动的识别系统。
此阶段的代表性工作有:
Goldstion、Harmon和Lesk等人用几何特征参数来表示人脸正面图像。
他们采用21维特征矢量表示人脸面部特征,并设计了基于这一表示法的识别系统。
Kaya和Kobayashi则采用了统计识别的方法,用欧氏距离来表示人脸特征,例如嘴和鼻子之间的距离,嘴唇的高度,两眼之间的距离等。
更进一步的,T.Kanad设计了快速且有一定知识引导的半自动回溯识别系统,创造性的运用积分投影法从单幅图像上计算出一组脸部特征参数,再利用模式分类技术与标准人脸相匹配。
Kanad的系统实现了快速、实时的处理,是一个很大的进步。
总的来说,上述方法都需要利用操作员的某些先验知识,始终摆脱不了人的干预。
第三阶段一自动识别阶段:
这一阶段真正实现了机器自动识别,产生了众多人脸识别方法,出现了多种机器全自动识别系统。
近十余年来,随着高速度、高性能计算机的发展,人脸识别方法有了较大的突破,提出了多种机器全自动识别系统。
近年来,人脸识别技术研究也非常活跃,除了基于K一L变换的特征脸方法与奇异值特征为代表的代数特征方法取得了发展外,人工神经网络、隐马尔可夫模型·
小波变换等也在人脸识别研究中得到了广泛的应用,而且出现了不少人脸识别的新方法。
本文将在1.3节介绍人脸识别的主要内容与方法。
1.2.2国内外发展现状
目前,国外对人脸识别问题的研究比较多,其中比较著名的有MTI、CMU、Cornell和Rockfeller等,MPEG标准组织也已经建立了专门的人脸识别草案小组。
国际上发表的相关论文数量也大幅度增长,EIEE的著名国际会议,如EIEEInternationalConferenceonAutomaticFaceandGestureRecognition、InternationalConferenceonImageProcessing、ConferenceonComputerVisionandPatternRecognition等,每年都有大量关于人脸识别的论文。
截至2005年3月,EIEE/IEE全文数据库中收录的关于“face”的文章8916篇,其中有关“facerecognition”的3280篇,约占36.8%,并且每年的文献呈急剧上升趋势。
同样在工程索引El中,至2005年3月,共有81657篇有关“face”的文献,数目是惊人的,并且2000年后快速增长。
国内对人脸识别领域的研究起步较国外晚,但近十年来呈现飞速发展,据中国期刊网统计,1996年至2005年3月,有关“人脸”的文献1467篇,其中人脸识别领域的文章494篇,并且再近几年获得快速增长,也预示人脸识别领域得到快速发展。
目前国内大部分高校有人从事人脸识别相关的研究,其中技术比较先进的有中科院自动化所、清华大学、浙江大学等。
1.3人脸识别的主要方法
自动人脸识别技术(AFR)就是利用计算机技术,根据数据库的人脸图像,分析提取出有效的识别信息,用来“辨认”身份的技术。
人脸识别技术的研究始于六十年代末七十年代初,其研究领域涉及图像处理、计算机视觉、模式识别、计算机智能等领域,是伴随着现代化计算机技术、数据库技术发展起来的综合交叉学科。
1.3.1人脸识别的视觉机理
近几年的研究表明,人类视觉数据处理是多层次的过程,其中最低层的视觉过程(视网膜功能)起到信息转储作用,即将大量图像数据转换为较为抽象的信息,这一任务由视网膜中的两类细胞完成:
低层次的细胞对空间的响应与小波变换作用类似,高层次的细胞则依据低层次细胞的响应,而作出具体的线、面乃至物体模式的响应。
这表明在视觉处理过程中,神经元并不是随便的、不可靠的把视觉图像的光照强度投射到感觉中枢,它们可以检测模式单元,区分物体的深度,排除无关的变化因素,并组成一个令人感兴趣的层次结构。
人脸识别不仅有着以上普通视觉过程的特点,而且具有以下独特之处。
1.人脸识别是大脑中一个特有的过程。
针对人脸识别,大脑中存在一个专门的处理过程;
2.在人脸感知与识别过程中,局部特征与整体特征均起作用。
若存在明显的局部特征,整体特征将不起作用;
3.不同的局部特征作用对识别的贡献也不同。
在正面人脸图像中,头发、人脸轮廓、眼睛以及嘴巴对识别和记忆有着重要影响,鼻子的作用则不是很重要。
但在侧面人脸识别中,鼻子对特征点的匹配很有作用。
通常来讲人脸的上部比下部对识别作用更大些;
4.不同空间频率上信息的作用不同。
低频信息代表了整体的描述,高频信息包含了局部的细节。
对于性别的判断,仅利用低频信息就足够了,对于身份识别没有高频信息就无法完成;
5.光照对视觉有影响。
有实验表明,从人脸底部打光会导致识别困难;
6.动态信息比静态信息更利于识别。
研究还发现,对熟悉的人脸,人类的识别能力在动态场景中要高于静态场景;
7.十岁以下的儿童识别人脸较多的采用显著特征,而较少的使用整体分析;
8.不同的种族。
性别的人脸识别的难易程度不同,这可能因为不同类型的人脸图像具有不同的特征;
9.面部表情的分析与人脸识别并行处理。
通过对脑部受损的病人研究表明,表情的分析与识别虽有联系,但总体来说是分开处理的。
人脸识别是一种复杂的信息处理任务,它的研究涉及计算机技术、心理学和神经生理学。
视觉机理、心理学和神经生理学的研究结果无疑将非常有益于人脸识别技术的发展,这些结论对于设计有效的识别方法起到了一定启发作用。
但除少数文献外[24],机器识别人脸的研究还是独立于心理学和神经生理学的研究的。
1.3.2人脸识别系统的组成
在人脸识别技术发展的几十年中,研究者们提出了多种多样的人脸识别方法,但大部分的人脸识别系统主要由三部分组成:
图像预处理、特征提取和人脸的分类识别。
一个完整的自动人脸识别系统还包括人脸检测定位和数据库的组织等模块,如图1-1。
其中人脸检测和人脸识别是整个自动人脸识别系统中非常重要的两个技术环节,并且相对独立。
下面分别介绍这两个环节。
图1-1人脸识别系统框图
人脸检测与定位
检测图像中是否有人脸,若有,将其从背景中分割出来,并确定其在图像中的位置。
在某些可以控制拍摄条件的场合,如警察拍罪犯照片时将人脸限定在标尺内,此时人脸的定位很简单。
证件照背景简单,定位也比较容易。
在另一些情况下,人脸在图像中的位置预先是未知的,比如在复杂背景下拍摄的照片,这时人脸的检测与定位将受以下因素的影响:
1.人脸在图像中的位置、角度、不固定尺寸以及光照的影响;
2.发型、眼镜、胡须以及人脸的表情变化等;
3.图像中的噪声等。
特征提取与人脸识别
特征提取之前一般需要做几何归一化和灰度归一化的工作。
前者是指根据人脸定位结果将图像中的人脸变化到同一位置和大小;
后者是指对图像进行光照补偿等处理,以克服光照变化的影响,光照补偿能够一定程度的克服光照变化的影响而提高识别率。
提取出待识别的人脸特征之后,即可进行特征匹配。
这个过程是一对多或者一对一的匹配过程,前者是确定输入图像为图像库中的哪一个人(即人脸识别),后者是验证输入图像的人的身份是否属实(即人脸验证)。
以上两个环节的独立性很强。
在许多特定场合下人脸的检测与定位相对比较容易,因此“特征提取与人脸识别环节”得到了更广泛和深入的研究。
近几年随着人们越来越关心各种复杂的情形下的人脸自动识别系统以及多功能感知研究的兴起,人脸检测与定位才作为一个独立的模式识别问题得到了较多的重视。
本文主要研究人脸的特征提取与分类识别的问题。
1.3.3主要的人脸识别方法
人脸识别技术作为模式识别领域的一个研究热点,每年都有许多相应的研究成果发表,并且涌现出各种各样的识别方法,可以说信息处理领域的各种新方法的研究和算法的改进都尝试在人脸识别中得到应用。
文献对近十年来人脸识别领域取得的成果进行了总结。
人脸识别方法的分类,根据研究角度的不同,可以有不同的分类方法,这是研究人脸识别方法首先遇到的问题。
本文在深入研究国内外人脸识别技术的发展和研究成果的同时,将已有的不同的分类方法做一个比较,目的是希望能从不同角度认识人脸识别问题,在较全面的了解各种方法优缺点的基础上,给本文的人脸识别方法提供研究方向。
根据输入图像中人脸的角度,人脸识别技术可分为基于正面、侧面、倾斜人脸图像的人脸识别。
由于实际情况的要求,对人脸正面模式的研究最多,这也是本文的研究内容。
根据图像来源的不同,人脸识别技术可分为两大类:
静态人脸识别和动态人脸识别。
静态人脸识别,即人脸来源为稳定的二维图像如照片。
如果人脸的来源是一段视频图像,则人脸识别就属于动态人脸识别。
在头部运动和表情变化状态下的人脸识别都可以看作动态人脸识别,如视频监视中的人脸识别。
动态人脸识别具有更大的难度:
首先,视频输出的图像质量较差:
其次,背景较复杂,目前对动态人脸识别的研究还局限于简单背景,较少人物的情况,对静态人脸识别的研究比较多。
本文的研究也是基于静止图像的。
根据人脸识别技术的发展历史,人脸识别方法大致可分为基于几何特征的人脸识别方法、基于模板匹配的人脸识别方法和基于模型的人脸识别方法。
a.基于几何特征的人脸识别方法
这是人脸识别技术发展中,应用最早的方法。
该方法是通过提取人脸的几何特征,包括人脸部件的归一化的点间距离、比率以及人脸的一些特征点,如眼角、嘴角、鼻尖等部位所构成的二维拓扑结构进行识别的方法。
所构造的几何特征既要清晰区分不同对象人脸的差异,又要对光照背景条件不敏感,常规的几何特征量很难满足这些要求。
因此该方法识别效果不理想。
b.基于模板匹配的人脸识别方法
基于模板匹配的方法,主要是利用计算模板和图像灰度的自相关性来实现识别功能。
一般基于人脸的全局特征,利用人脸模板和相关参数如灰度的相关性来进行检测和识别的。
Berto在中将基于几何模型的人脸识别方法和模板匹配进行了全面比较后,得出结论:
前者具有识别速度快和内存要求小的优点,但在识别率上后者要优于前者。
增加几何特征对于基于几何特征的人脸识别方法只能轻微的提高识别率,因为要提高几何特征的提取质量本身就十分困难,而且随着图像质量的下降和人脸遮挡的引入,基于几何特征的人脸识别效果会大幅下降。
总之,认为模板匹配法要优于几何特征法。
c.基于模型的人脸识别方法
通过统计分析和匹配学习找出人脸和非人脸,以及不同人脸之间的联系。
该方法包括特征脸法(Eigenface)、神经网络方法(NN)、隐马尔可夫模型方法(HMM)和支持向量机(SVM)等方法。
和模板匹配的方法相比,基于模型方法的模板是通过样本学习获得,而非人为设定。
所以该方法,从原理上更为先进合理,实验中也表现出更好的识别效果。
根据人脸表征方式(即特征提取)的不同,还可以将人脸识别技术分为三大类:
基于几何特征的识别方法、基于代数特征的识别方法和基于连接机制的识别方法。
该方法在上文中已有阐述,它将人脸用一个几何特征矢量表示,用模式识别中层次聚类的思想设计分类器达到识别目的。
该方法的困难在于没有形成一个统一的、优秀的特征提取标准。
由于人面部的模式千变万化,即使是同一个人的面部图像,由于时间、光照、摄影机角度等不同,也很难用一个统一的模式来表达,造成了特征提取的困难。
不过,由于现在各种优秀特征提取算法(如动态模板、活动轮廓等)的提出,使得人脸的几何特征描述越来越充分。
而且在表情分析方面,人脸的几何特征仍然是最有力的判据。
b.基于代数特征的人脸识别方法
这类识别法仍然是将人脸用特征矢量表示,只不过用的是代数特征矢量。
该方法在实际应用中取得了一定的成功。
由于代数特征矢量(即人脸图像向各种人脸子空间的投影)具有一定的稳定性,识别系统对不同的倾斜角度,乃至不同的表情均有一定的鲁棒性。
所以,也说明了这种方法对表情的描述不够充分,难以用于表情分析。
c.基于连接机制的人脸识别方法
这类识别法将人脸直接用灰度图(二维矩阵)表征,利用了神经网络(NeuralNetwork,NN)的学习能力及分类能力。
这种方法的优势在于保存了人脸图像中的纹理信息及细微的形状信息,同时避免了较为复杂的特征提取工作。
而且,由于图像被整体输入,符合格氏塔(Gestalt)心理学中对人类识别能力的解释。
与前两种识别方法相比,基于连接机制的识别法具有以下明显不同:
信息处理方式是并行而非串行;
编码存储方式是分布式。
但由于原始灰度图像数据量十分庞大,因此神经元数目通常很多,训练时间很长。
另外,完全基于神经网络的识别法在现有的计算机系统(冯一诺伊曼结构)上也有其内在的局限性。
神经网络虽然有较强的归纳能力,但当样本数目大量增加时,其性能可能会严重下降。
本文根据人脸表征方法与特征综合方式的不同,认为将人脸识别方法分为基于几何特征的方法、基于模板匹配的方法和基于统计学习的方法,比较合适。
此分类方法即符合人脸识别技术发展的历史,又将人脸特征提取与分类识别有机的结合在一起。
识别人脸主要依据那些在不同个体之间存在较大差异,而对于同一个人比较稳定的特征,具体的特征形式和综合方式(分类方式)的不同决定了识别方法的不同。
图1-2列出了主要的人脸特征与综合方法。
早期静态人脸识别方法研究较多的是基于几何特征的方法和基于模板匹配方法。
目前,静止图像的人脸识别方法主要是基于样本通过统计学习识别人脸的方法,主要研究方向有:
基于代数特征的识别方法,包括特征脸(Eigenface)方法和隐马尔可夫模型(HMM)方法;
基于连接机制的识别方法,包括一般的神经网络方法和弹性图匹配(ElasticGraphMatching)方法,以及以上方法的一些综合方法。
基于统计学习的方法属于基于整体的研究方法,它主要考虑了模式的整体属性。
因为基于整体的人脸识别不仅保留了人脸部件的拓扑关系,而且也保留了各部件本身的信息。
文献认为基于整个人脸的分析要优于基于部件的分析,理由是前者保留了更多信息。
对于基于整个人脸的识别而言,由于把整个人脸图像作为模式,那么光照、视角以及人脸尺寸会对人脸识别有很大的影响,因此如何能够有效的去掉这些干扰就尤为关键。
神经网络的方法在人脸识别上有其独到的优势,即它避免了复杂的特征提取工作,可以通过学习的过程获得其它方法难以实现的关于人脸识别的规律和规则的隐性表达。
但是NN方法通常需要将人脸作为一个一维向量输入,因此输入节点庞大,降维就显得尤为重要。
根据文献对于自组织神经网络方法的分析,认为可采用自组织神经网络的P个节点来表达原始的N个输入(P<
N),但由于将P个节点进行分类,其识别的效果仅相当于提取人脸空间特征向量后进行的识别分类,因此采用此类神经网络进行识别的效果只能是特征脸的水平。
除此之外,由于人脸处在高维空间,如一幅不大的100x100的图像为10000维,这样神经网络的输入节点将很庞大,因此实际训练网络的参数繁多,实现起来很困难。
神经网络方法的优点是可以针对特定的问题进行子空间设计,比如用于人脸检测、性别识别、种族识别等(不属于本文的研究内容)。
鉴于以上考虑,本文未对此方法进行重点研究。
图1-2可以提取的各种人脸特征,图下方为各种特征的综合方式
通过对不同的人脸识别分类方法的总结,多视角的、全面的介绍了主要的人脸识别方法。
从对人脸识别方法的分析中可以看出,每种方法各有其优缺点,因此一些学者倾向于将多种方法综合起来,或同时利用不同种类的特征,图1-2为人脸图像可以提取的特征以及可能的特征综合方法。
在对各种人脸识别方法进行理论分析后,本文主要研究基于统计学习的、整体的人脸识别方法,包括特征脸法、基于独立分量分析的人脸识别方法和基于隐马尔可夫模型的人脸识别方法,并尝试新的特征提取和分类方法。
1.4人脸识别测试数据库
人脸识别是近年来研究的热点,各国研究人员提出了各种新的识别算法,为测试和比较各种识别技术的优缺点及其识别率的高低,世界各研究机构都建立了各自的人脸测试和测评数据库,下面介绍一些著名的标准数据库。
1.英国ORL(O一OliverttiResearchLaboratory)人脸数据库
ORL人脸图像库是由英国剑桥011vetti实验室从1992年4月到1994年4月期间拍摄的一系列人脸图像组成,共有40个不同年龄、不同性别和不同种族的对象。
每个对象10幅图像共计400幅灰度图像组成,图像尺寸为92xlZl,图像背景为黑色。
其中人脸部分表情和细节均有变化,例如笑与不笑,眼睛睁着或闭着,戴或不戴眼镜等,人脸姿态也有变化,其深度旋转和平面旋转可达20度,人脸的尺寸也有最多10%的变化。
该库是目前使用最广泛的标准数据库,它含有大量的比较结果。