关于人脸识别进行图像预处理模块的可行性研究报告.docx
《关于人脸识别进行图像预处理模块的可行性研究报告.docx》由会员分享,可在线阅读,更多相关《关于人脸识别进行图像预处理模块的可行性研究报告.docx(10页珍藏版)》请在冰豆网上搜索。
关于人脸识别进行图像预处理模块的可行性研究报告
关于人脸识别进行图像预处理模块的可行性研究报告
报告目录
第一章前言
第一节课题背景
一课题的来源------------------------------------------------------------------------------1
二人脸识别技术的研究意义------------------------------------------------------------2
第二节人脸识别技术的国内外发展概况---------------------------------------------------3
一国外发展概况------------------------------------------------------------------------3
二国内发展概况---------------------------------------------------------------------------4
第二章系统的需求分析和方案选择---------------------------------------------------------6
第一节可行性分析------------------------------------------------------------------------------6
一技术可行性分析------------------------------------------------------------------------6
二操作可行性分析------------------------------------------------------------------------7
第二节需求分析---------------------------------------------------------------------------------7
一应用程序的功能需求分析------------------------------------------------------------7
二开发环境的需求分析------------------------------------------------------------------8
三运行环境的需求分析------------------------------------------------------------------8
第三节预处理方案选择------------------------------------------------------------------------9
一设计方案原则的选择------------------------------------------------------------------9
二图像文件格式选择---------------------------------------------------------------------9
三开发工具选择---------------------------------------------------------------------------9
第一章前言
第一节课题背景
一课题的来源
随着安全入口控制和金融贸易方面应用需要的快速增长l、生物统计识别技术得到了新的重视.目前l、微电子和视觉系统方面取得的新进展l、使该领域中高性能自动识别技术的实现代价降低到了可以接受的程度.而人脸识别是所有的生物识别方法中应用最广泛的技术之一l、人脸识别技术是一项近年来兴起的l、但不大为人所知的新技术.人们更多的是在电影中看到这种技术的神奇应用:
警察将偷拍到的嫌疑犯的脸部照片l、输入到电脑中l、与警方数据库中的资料进行比对l、并找出该嫌犯的详细资料和犯罪记录.这并非虚构的情节.在国外l、人脸识别技术早已被大量使用在国家重要部门以及军警等安防部门.在国内l、对于人脸识别技术的研究始于上世纪90年代l、目前主要应用在公安、金融、网络安全、物业管理以及考勤等领域.
二人脸识别技术的研究意义
1、富有挑战性的课题
人脸识别是机器视觉和模式识别领域最富有挑战性的课题之一l、同时也具有较为广泛的应用意义.人脸识别技术是一个非常活跃的研究领域l、它覆盖了数字图像处理、模式识别、计算机视觉、神经网络、心理学、生理学、数学等诸多学科的内容.如今l、虽然在这方面的研究已取得了一些可喜的成果l、但是FRT在实用应用中仍面临着很严峻的问题,因为人脸五官的分布是非常相似的l、而且人脸本身又是一个柔性物体l、表情、姿态或发型、化妆的千变万化都给正确识别带来了相当大的麻烦.如何能正确识别大量的人并满足实时性要求是迫切需要解决的问题.
2、面部关键特征定位及人脸2D形状检测技术
在人脸检测的基础上l、面部关键特征检测试图检测人脸上的主要的面部特征点的位置和眼睛和嘴巴等主要器官的形状信息.灰度积分投影曲线分析、模板匹配、可变形模板、Hough变换、Snake算子、基于Gabor小波变换的弹性图匹配技术、主动性状模型和主动外观模型是常用的方法.
可变形模板的主要思想是根据待检测人脸特征的先验的形状信息l、定义一个参数描述的形状模型l、该模型的参数反映了对应特征形状的可变部分l、如位置、大小、角度等l、它们最终通过模型与图像的边缘、峰、谷和灰度分布特性的动态地交互适应来得以修正.由于模板变形利用了特征区域的全局信息l、因此可以较好地检测出相应的特征形状.由于可变形模板要采用优化算法在参数空间内进行能量函数极小化l、因此算法的主要缺点在于两点:
一、对参数初值的依赖程度高l、很容易陷入局部最小;二、计算时间长.针对这两方面的问题l、我们采用了一种由粗到细的检测算法:
首先利用人脸器官构造的先验知识、面部图像灰度分布的峰谷和频率特性粗略检测出眼睛、鼻子、嘴、下巴的大致区域和一些关键的特征点;然后在此基础上l、给出了较好的模板的初始参数l、从而可以大幅提高算法的速度和精度.
眼睛是面部最重要的特征l、它们的精确定位是识别的关键.基于区域增长的眼睛定位技术l、该技术在人脸检测的基础上l、充分利用了眼睛是面部区域内脸部中心的左上方和右上方的灰度谷区这一特性l、可以精确快速的定位两个眼睛瞳孔中心位置.该算法采用了基于区域增长的搜索策略l、在人脸定位算法给出的大致人脸框架中l、估计鼻子的初始位置l、然后定义两个初始搜索矩形l、分别向左右两眼所处的大致位置生长.该算法根据人眼灰度明显低于面部灰度的特点l、利用搜索矩形找到眼部的边缘l、最后定位到瞳孔的中心.实验表明l、本算法对于人脸大小、姿态和光照的变化l、都有较强的适应能力l、但在眼部阴影较重的情况下l、会出现定位不准.佩戴黑框眼镜l、也会影响本算法的定位结果.
3、面部感知系统的重要内容
基于视觉通道信息的面部感知系统l、包括人脸检测和跟踪、面部特征定位、面部识别、人脸归类(年龄、种族、性别等的判别)、表情识别、唇读等分系统l、如图1-1所式l、可以看出l、继人脸检测和跟追之后l、面部特征定位通常是面部感知的一个必备环节l、是后续工作的基础l、具有重要的意义.尽管人脸识别不能说是其他面部感知模块的必备功能l、但是l、可以肯定的是l、利用已知的身份信息l、结合特定人的先验知识l、可以提高表情分析、唇读和语音识别、手势识别乃至手写体识别的可靠性.而计算机对使用者身份确认的最直接的应用就是基于特定使用者的环境设置:
如使用者的个性化工作环境l、信息的共享和隐私保护等等.
图1-1面部感知系统结构图
第二节人脸识别的国内外发展概况
现在人脸识别技术已经应用在许多领域中l、并起到了举足轻重的作用l、人脸识别研究开始于1966年PRI的Bledsoe的工作l、经过三十多年的发展l、人脸识别技术取得了长足的进步l、现在就目前国内外的发展情况来进行展述.
一国外的发展概况
见诸文献的机器自动人脸识别研究开始于1966年PRI的Bledsoe的工作l、1990年日本研制的人像识别机l、可在1秒钟内中从3500人中识别到你要找的人.1993年l、美国国防部高级研究项目署(AdvancedResearchProjectsAgency)和美国陆军研究实验室(ArmyResearchLaboratory)成立了Feret(FaceRecognitionTechnology)项目组l、建立了feret人脸数据库l、用于评价人脸识别算法的性能.
美国陆军实验室也是利用vc++开发l、通过软件实现的l、并且FAR为49%.在美国的进行的公开测试中l、FARl、为53%.美国国防部高级研究项目署l、利用半自动和全自动算法.这种算法需要人工或自动指出图像中人的两眼的中心坐标l、然后进行识别.在机场开展的测试中l、系统发出的错误警报太多l、国外的一些高校(卡内基梅隆大学(CarnegieMellonUniversity)为首l、麻省理工大学(MassachusettsInstituteofTechnology)等l、英国的雷丁大学(UniversityofReading))和公司(Visionics公司Facelt人脸识别系统、Viiage的FaceFINDER身份验证系统、LauTech公司Hunter系统、德国的BioID系统等)的工程研究工作也主要放在公安、刑事方面l、在考试验证系统的实现方面深入研究并不多.
二国内的发展概况
人脸识别系统现在在大多数领域中起到举足轻重的作用l、尤其是用在机关单位的安全和考勤、网络安全、银行、海关边检、物业管理、军队安全、智能身份证、智能门禁、司机驾照验证、计算机登录系统.我国在这方面也取得了较好的成就l、国家863项目“面像检测与识别核心技术”通过成果鉴定并初步应用l、就标志着我国在人脸识别这一当今热点科研领域掌握了一定的核心技术.北京科瑞奇技术开发股份有限公司在2002年开发了一种人脸鉴别系统l、对人脸图像进行处理l、消除了照相机的影响l、再对图像进行特征提取和识别.这对于人脸鉴别特别有价值l、因为人脸鉴别通常使用正面照l、要鉴别的人脸图像是不同时期拍摄的l、使用的照相机不一样.系统可以接受时间间隔较长的照片l、并能达到较高的识别率l、在计算机中库藏2300人的正面照片l、每人一张照片l、使用相距1--7年、差别比较大的照片去查询l、首选率可以达到50%l、前20张输出照片中包含有与输入照片为同一人的照片的概率可达70%. 2005年1月18日l、由清华大学电子系人脸识别课题组负责人苏光大教授主持承担的国家"十五"攻关项目《人脸识别系统》通过了由公安部主持的专家鉴定.鉴定委员会认为l、该项技术处于国内领先水平和国际先进水平.
本论文主要对该人脸识别系统进行模块划分l、并介绍各模块的功能l、重点介绍图像预处理模块l、对其内的子模块的功能和算法进行详细讲述l、主要介绍光线补偿、图像灰度化、高斯平滑、均衡直方图、图像对比度增强l、图像预处理模块在整个系统中起着极其关键的作用l、图像处理的好坏直接影响着后面的定位和识别工作.
第二章系统的需求分析与方案选择
人脸识别系统现在应用于许多领域中l、但是人脸识别技术也是一项近年来兴起的l、且不大为人所知的新技术.在我国以及其他国家都有大量的学者正在研究之中l、不断的更新人脸识别技术l、以便系统的识别准确率达到新的高度.
第一节可行性分析
在开发该人脸识别软件之前l、我们查询了前人所写过的诸多论文以及源程序l、在开发之时l、结合了资料中的算法并揉进了自己的一些思想l、使程序可以对人脸图片进行简易识别.
一技术可行性
图像的处理方法很多l、我们可以根据需要l、有选择地使用各种方法.
在确定脸部区域上l、通常使用的方法有肤色提取.肤色提取l、则对脸部区域的获取则比较准确l、成功率达到95%以上l、并且速度快l、减少很多工作.
图像的亮度变化l、由于图像的亮度在不同环境的当中l、必然受到不同光线的影响l、图像就变得太暗或太亮l、我们就要对它的亮度进行调整l、主要采取的措施是对图像进行光线补偿.
高斯平滑:
在图像的采集过程中,由于各种因素的影响,图像中往往会出现一些不规则的随机噪声,如数据在传输、存储时发生的数据丢失和损坏等,这些都会影响图像的质量l、因此需要将图片进行平滑操作以此来消除噪声.
灰度变换:
进行灰度处理l、我们要保证图像信息尽可能少的丢失.同样在进行灰度变换前l、我们也要对图像的信息进行统计l、找出一个比较合理的灰度值l、才能进行灰度变换.
灰度均衡:
灰度变换后l、就要进行灰度均衡l、可以根据灰度分布来进行灰度均衡.
对比度增强:
将所要处理的区域和周围图像区域进一步拉开他们的对比度l、使它们更加明显l、主要通过像素的聚集来实现.
二操作可行性
该人脸识别软件需要如下的运行环境:
CPU:
500M及以上;内存:
64M及以上.安装有Windows98、WindowsMe、Windows2000、WindowsNT等操作系统中的其中一种.另还装有摄像头可进行随机拍照和识别.因此l、从操作可行性来看l、只要系统用户的硬件软件设备满足以上条件l、即可用该人脸识别软件进行人脸的识别.
第二节需求分析
一应用程序的功能需求分析
该软件最主要的功能就是要能识别出人脸l、首先该系统需要对通过摄像头拍照而获取到的原始的人脸图片进行一系列处理才可进行下一步的工作l、该处理过程也称图像预处理.预处理这个模块在整个人脸识别系统的开发过程中占有很重要的地位l、只有预处理模块做的好l、才可能很好的完成后面的人脸定位和特征提取这两大关键模块.因此本设计中所要完成的主要功能如下所述:
图像获取功能:
该模块主要是从摄像头拍照后进行获取图片l、也可以从图片库中获取l、获取后的图片可以在软件的界面中显示出来以便进行识别.
图像预处理功能:
该模块主要包括图像光线补偿、图像变成灰色、高斯平滑、均衡直方图、实现图像对比度增强、二值化变换等.
人脸定位功能:
该模块主要是将处理后的人脸图片进行定位l、将眼睛、鼻子、嘴巴标记出来l、以便进行特征提取.
特征提取功能:
该模块是在定位后的人脸图片中将眼睛、鼻子、嘴巴的特征值提取出来.
识别功能:
该模块是将从图片中提取的特征值和后台数据库中的值进行比较来完成识别功能.
二开发环境需求分析
1、硬件环境
(1)硬件配置原则
具有可靠性l、可用性和安全性l、具有完善的技术支持.能够满足个人学习和设计需要.
(2)运行本软件所需的硬件资源
CPU:
800M及以上;内存:
128M及以上
2、软件环境
(1)系统软件配置原则
能够满足该软件的可靠性l、可用性和安全性的要求
(2)系统软件配置方案
①配置有持续工作能力、高稳定性、高度可集成的开放式标准的操作系统l、如Windows2000l、WindowsNTl、UNIXl、Linux等.
②配备符合ANSI/ISO标准的高级程序设计语言处理软件.如:
VisualC++6.0.
③熟悉C++高级程序设计语言.
3、运行环境需求分析
(1)、硬件环境
CPU:
500M及以上;内存:
64M及以上.
(2)、软件环境
可以运行在微软公司近年来所出的各种操作系统.如Windows98、WindowsMe、Windows2000、WindowsNT等.
第三节预处理方案选择
一设计方案原则的选择
本应用程序的设计方案原则如下:
1、采用较为先进的技术力量l、保证应用程序在技术上具备一定的优势.
2、采用成熟的技术l、保证应用程序的安全性和可靠性.
3、应用程序便于扩展和维护l、易于技术的更新.
4、应用程序充分利用现有的资源l、尽量减少不必要的再投资.
5、编写的代码必须严谨易读l、代码的解释必须清楚明白l、为应用程序的再开发提供应尽的责任.
二图像文件格式选择
在设计的过程中l、为了定位和特征提取的方便l、我们采用的是24位位图.
三开发工具选择
本次设计所用的开发工具是MicrosoftVisualC++6.0.VisualC++6.0是Microsoft公司推出的一种可视化编程工具.它支持多平台和交叉平台的开发l、将各种编程工具如编辑器、连接器、调试器等巧妙的结合在一起l、构成一个完美的可视化开发环境.用户无需通过繁杂的编程操作l、即可完成Windows下应用程序的编辑、编译、测试和细化等工作.