人脸朝向识别.docx
《人脸朝向识别.docx》由会员分享,可在线阅读,更多相关《人脸朝向识别.docx(13页珍藏版)》请在冰豆网上搜索。
![人脸朝向识别.docx](https://file1.bdocx.com/fileroot1/2022-10/27/b21ef9dd-dbdb-49a7-95dd-780bed0f0394/b21ef9dd-dbdb-49a7-95dd-780bed0f03941.gif)
人脸朝向识别
人脸朝向识别
摘要
本文研究的是根据人脸图像对其朝向角度进行识别的问题。
首先,运用基于边缘检测Canny算子的随机Hough变换来定位瞳孔和鼻尖的坐标。
然后在人脸平面图上构造向量,计算偏向系数P。
将前30张人脸朝向图的P值作为参考数据,分析其特点以确定模型的识别区间。
然后利用标定好的识别模型对余下图片的人脸朝向进行识别并与实际朝向进行对比,得到模型的识别率r为XX,误判一张。
关键词:
人脸朝向识别边缘检测随机Hough变换
一.问题重述
人脸朝向识别是人脸应用研究中重要的一步,在众多研究领域中,人脸朝向识别是一个无法回避的问题。
现有一组人脸朝向不同角度时的图像数据,图像来自不同的10个人(详见附件),每人五幅图像,人脸的朝向分别为:
左方、左前方、前方、右前方和右方,如图一所示。
图一人脸图像
试建立人脸朝向识别模型,对人脸的朝向进行识别。
二.模型假设
1.人脸朝向只分左,左前,前,右前,右5个方向,其余朝向不予考虑:
2.不考虑人脸中的复杂表情对提取的特征的影响。
三.符号说明
向左的人脸图像的集合
向左前方的人脸图像的集合
向正前方的人脸图像的集合
向右前方的人脸图像的集合
向右的人脸图像的集合
边缘点集中的第i个元素
提取的左眼点的横坐标
提取的右眼点的横坐标
提取的鼻子的点的横坐标
提取的左眼点的纵坐标
提取的右眼点的纵坐标
提取的鼻子的点的纵坐标
两眼连线方向上的单位向量
OM方向的向量
偏向系数
r模型识别率
四.问题分析
题目要求建立人脸朝向识别模型,对10个人的不同朝向的脸进行识别。
由于所给的图片是二维的平面图,不同朝向的人脸的特征部位,如眼睛,鼻子,嘴等的位置差别明显,故将此作为识别朝向的依据。
根据得到的特征点坐标进行向量运算将此差别量化,再选择部分图片作为样本对偏向系数标定,就可以得到朝向识别的模型。
最后用模型对余下图片进行识别并分析其识别性能。
五.模型的建立与求解
5.1Canny算子进行边缘检测
人脸图像存在多种影响识别效果的因素:
采集环境光照,采集设备噪声,图像背景、服饰、发型,图像高维度。
在识别前,需要对图像进行预处理。
然后再选择在图像去噪和边缘细节保留上具有相对较好的平衡的Canny算子检测边缘。
5.1.1高斯滤波消除噪声
噪声也属于高频信号,图像处理之前需要先经过去噪,选择使用高斯滤波模板对图像进行卷积。
由高斯函数
,其中
即可得到图像中点的灰度A(x,y)经过平滑滤波得到灰度值G(x,y)。
5.1.2求出偏导数
图像的边缘有方向和幅度两个特征,通常沿边缘方向的像家变化剧烈,这种变化(不连续性)常可以利用求一阶导数的方法来检测边缘。
使用微分算子求G(x,y)的偏导数
,
梯度大小。
由此得到偏导数。
5.1.3非极大值抑制得到初步边缘点
沿幅角方向检测磨制的极大值点即边缘点,遍历8个方向图像像素,把每个像素偏导值与相邻像素的模值比较,取其max值为边缘点,置像素灰度值为0.
8个临域幅角方向如表一所示。
表一8临域幅角方向
4
3
2
1
B
1
2
3
4
图一边缘方向示意图
5.1.4双阀值检测
由于单阈值处理时,合适的阈值选择较困难,常常需要采用反复试验,因此采用双阈值检测算法。
对经过非极大值抑制后的图像作用两个阈值th1,th2,th1=0.4th2,两个阈值作用后得到两个图像1、2,较大阈值检测出的图像2去除了大部分噪声,但是也损失了有用的边缘信息。
较小阈值检测得到的图像1则保留着较多的边缘信息,以此为基础,补充图像2中的丢失的信息,连接图像边缘即得到检测结果。
对题目所给图像文件中的人脸朝向图(1-1)进行边缘检测结果如图一所示。
图二Canny边缘检测的结果
5.2随机Hough变换提取面部特征
Hough变换是图像处理中从图像识别几何形状的基本方法之一,应用很广泛。
Hough圆检测可靠性高,对噪声、变形、部分区域残缺、边缘不连续等有较好的适应性。
可用改进后的随机Hough变换定位瞳孔的坐标和,将其作为眼睛的精确定位。
5.2.1确定瞳孔圆参数参数
首先构造边缘点集D存储所有边缘点至集合D,并记录各点的梯度方向,初始化参数单元集P=NULL。
然后从D中随机选取3点,,,代入下式
计算这3点所确定的圆的参数p(a,b,c)。
然后判断法线方向与梯度之差是否在允许的范围内,若是则进行下一步,否则重新选择一组点知道符合为止。
5.2.2检测
人在P中寻找候选圆,满足,是允许误差,若找到则转进行下一步,否则将p插入P,令其计数值为1。
若a-r当该参数对应的圆上的点数时,进行下一步,不然的话该圆为虚假圆,把该圆的参数特征从P中剔除。
若检测到的为真实圆,判断已经检测到的圆是否已经达到了规定的数目,若是,则结束找寻;不然把圆上的点从边缘点集中除去,重置P=NULL再进行找寻,直到合格为止。
图三随机hough变换得出瞳孔的圆
同样运用MATLAB的程序进行操作,提取鼻子的特征值。
5.2.3确定瞳孔和鼻子的坐标
根据上一步提取的特征,可以得到双眼的坐标和以及鼻子的坐标。
x
图四眼睛的坐标表示
5.3人脸朝向分析参数的产生
精确定位出眼睛和鼻子之后,特征提取的工作就完成了。
接下来,我们要分析出人脸朝向。
为了避免脖子和头发的干扰,我们取眼睛以下,嘴部以上区域进行分析。
5.3.1计算模板准备
选出一个正脸程度较好的人脸图像,并且将该图像做Canny边缘检测和随机Hough变换后得到的人脸图和数据作为标准正向大头人脸模板。
双眼的坐标和,a,b=0,1,2,3,…通过查阅相关医学资料可得知,成人的眼部到嘴部的垂直距离一般在5cm到7cm之间,本题中我们对嘴的具体坐标的要求并不需要太精确,遂取其值为6cm。
两眼的距离为,
嘴的坐标为
鼻子的坐标为
5.3.2图像深度还原
将要进行识别的人脸图片与事先取得的正向人脸模板中人脸外接矩形分别标出。
由于所给的图片都是相同规格的,图片上的相同线段的长度表示的实际距离相同。
将图片的边框作为人脸的外接矩形标出来。
5.3.3判断标度的刻画
5.3.3.1算法构造
选取题目所给出的不同朝向的人脸图片1-1到6-5共30张图片,假设每张脸都将双眼的中点记为O,则O点得坐标为
式中a,b均取1,2,3,…,19,20。
以O点为起始点作沿双眼所在直线水平向右的单位向量,=(1,0)。
鼻子与中心点O的向量为
将向量与单位向量进行向量相乘,其结果为P
图五朝向右前方的人脸的坐标
图六朝向正前方的人脸的坐标
图七朝向左前方的人脸的坐标
5.3.3.2刻画标度
将经过前面步骤处理后的1-1到6-5号人脸朝向图片的相应的坐标值代入向量运算,计算出其P值。
将不同朝向的脸分别用A,B,C,D,E五个集合表示,其中A代表朝向左的人脸,B代表朝向左前方的人脸,C代表朝向正前方的人脸,D代表朝向右前方的人脸,E代表朝向右的人脸。
将1-1到6-5每张脸所对应的P值放入该朝向的脸所对应的集合中去,再将各集合中的元素进行数据统计,得到每个集合所含元素的取值范围,结果如表二所示。
表二各集合的P值取值范围
人脸朝
向集合
A
B
C
D
E
元素最大值
Pmax
元素最小值
Pmin
5.4人脸的朝向进行识别
5.4.1人脸的朝向进行识别
运用上述模型对余下的人脸朝向图片7-1到10-5分别进行一系列处理,最后计算得到P值。
将P与表二中的数据进行比对,将图片放入其所属的集合中去。
根据集合所代表的含义既可知道该图片中的人脸的朝向,结果如表三所示。
5.4.2识别结果分析
将运用模型进行人脸朝向识别所得的结果与真实的情况进行比对,统计识别正确的图片的数目n以及模型的人脸朝向识别的正确率r,结果如表四所示。
表三余下图片的识别结果
图片编号
7-1
7-2
7-3
7-4
7-5
8-1
8-2
8-3
8-4
8-5
识别
朝向
真实
朝向
E
D
C
B
A
E
D
C
B
A
图片编号
9-1
9-2
9-3
9-4
9-5
10-1
10-2
10-3
10-4
10-5
识别
朝向
真实
朝向
E
D
C
B
A
E
D
C
B
A
表四模型识别结果的分析
正确识别数n
识别正确率r
六.模型的评价与推广
6.1模型的优点
1.在进行图片特征提取的时候,运用了改进的随机Hough变换的方法,不仅能有效而准确地精确定位人眼,而且处理速度也有了明显的提高。
2.将人脸朝向的问题转化为人脸平面图上的向量运算,将抽象的问题具体化,使模型简明易懂。
6.2模型的缺点与改进
由于题目只要求识别5个方向的朝向,为了简化运算和求解的过程,我们所建立的模型对数据的处理和最后结果的规划并没有做更精确的处理。
再将该模型运用到人脸具体朝向角度的识别时,应该双眼连线与冠状面的夹角的正弦来标度,这样得到的改进模型就可以识别到人脸朝向图的具体方位了。
杨增俊兰聪刘向前
参考文献
[1]秦贵和,李宝玲.车载MOST网络音频播放节点的设计[J].计算机工程与应用,2007,43(26):
94-96.
[2]沈杰,王正群等.基于连续隐马尔可夫模型的人脸识别方法.[J]计算机工程与设计,2008,2(3):
707~709.
[3]张明恒.基于面部朝向的驾驶员精神分散监测方法研究[D].吉林:
吉林大学交通学院,2007.
[4]陈锐,李辉等.由人脸朝向驱动的多方向投影交互系统.小型微型计算机系统,2007年4月第4期。
[5]陈燕新,戚飞虎.基于随机Hough变换的快速圆检测方法[J].上海交通大学学报,1999,32(10):
17220.
附录