人脸识别技术应用于校园管理的关键算法研究 docx.docx
《人脸识别技术应用于校园管理的关键算法研究 docx.docx》由会员分享,可在线阅读,更多相关《人脸识别技术应用于校园管理的关键算法研究 docx.docx(14页珍藏版)》请在冰豆网上搜索。
![人脸识别技术应用于校园管理的关键算法研究 docx.docx](https://file1.bdocx.com/fileroot1/2022-11/30/59f80342-6bc4-42f2-ab2d-c45922f1ec34/59f80342-6bc4-42f2-ab2d-c45922f1ec341.gif)
人脸识别技术应用于校园管理的关键算法研究docx
人脸识别技术应用于校园管理的关键算法研究
一、绪论
(一)研究背景
当前很多国家展开了有关人脸识别[1]的研究,主要有美国,欧洲国家,日本等,著名的研究机构有美国的MIT的Medialab,AIlab,CMU的Human-ComputerInterfaceInstitute英国的DepartmentofEngineeringinUniversityofCambridge等。
国内关于人脸识别的研究始于二十世纪80年代,自九十年代在国家科学基金“863”计划等资助下,国内许多研究机构在人脸识别领域进行了卓有成效的研究。
研究工作主要集中于四大类方法答研究:
基于几何特征的人脸正面自动识别方法、基于代数特征的人脸正面识别方法、基于连接机制的人脸正面识别方法以及基于深度学习的人脸识别方法。
日前,人脸识别技术在证券金融领域、信息安全领域的应用甚为广泛。
在教育领域,此技术虽已经在一些校园中起到了潜移默化的作用,得到了一定的渗透,但仍旧不够全面,不够普及。
教育事业乃立国之本,强国之基,建设教育强国是社会主义现代化强国的应有之义,是基础工程,是有学者国从人力资源大国迈向人力资源强国的关键。
所以有学者们更应该将信息时代的产物高效地融合在现今的教育事业中。
(二)研究意义
随着社会的不断进步以及各个方面对于快速有效的自动身份验证的迫切要求,生物特征
识别技术[2]在近几十年中得到了飞速的发展。
作为人的一种内在属性,并且具有很强的自身稳定性及个体差异性,生物特征成为了自动身份验证的最理想依据。
当前的生物特征识别技术主要包括有:
指纹识别,视网膜识别,虹膜识别,步态识别,静脉识别,人脸识别等。
与其他识别技术相比,人脸识别由于具有直接,友好,方便的特点,使用者无任何心理障碍,易于为用户所接受,从而得到了广泛的研究与应用。
除此之外,有学者们还能够对人脸识别的结果作进一步的分析,得到有关人的性别,表情,年龄等诸多额外的丰富信息,扩展了人脸识别的应用前景。
研究人脸识别在理论和技术上都有着重要的意义:
一是可以推进对人类视觉系统本身的认识;二是可以满足人工智能应用的需要。
采用人脸识别技术,建立自动人脸识别系统,用计算机实现对人脸图像的自动识别有着广阔的应用领域和诱人的应用前景。
针对于教育领域,此技术可优化学校的教学管理,充分落实教育信息化这一理念,在日益发展的智慧校园时代,为广大学生及教育工作者带来极大的便利。
目前,人脸识别技术在诸多领域中的应用已经趋于成熟,所以有学者们可以将此技术加以高效利用,陆续投入到有学者们校园的日常管理工作中。
而如何高效地利用人脸识别技术在校园管理中的应用则是关键中的关键。
基于此,本文对人脸识别技术的关键算法进行了一定的分析,试图探究能否将人脸识别技术高效应用于校园管理,使其效果达到最优化。
二、常规降维算法介绍
常规算法包含:
拉普拉斯特征映射(LE),局部保持投影算法(LPP),强制性保留算法
(WLPP)[3]等诸多算法。
其中,针对于拉普拉斯特征映射(LE)以及局部保持投影算法(LPP),有学者们进行如下介绍。
(一)拉普拉斯特征映射(LE)
拉普拉斯特征映射[4](LaplacianEigenmaps)是一种不太常见的降维算法,它看问题的角度和常见的降维算法不太相同,是从局部的角度去构建数据之间的关系。
也许这样讲有些抽象,具体来讲,拉普拉斯特征映射是一种基于图的降维算法[5],它希望相互间有关系的点(在图中相连的点)在降维后的空间中尽可能的靠近,从而在降维后仍能保持原有的数据拉普结构。
其缺点是:
(1)该算法具有很高的鲁棒性[6],但是没有考虑到有些数据具有线性关系。
(2)LE算法仅仅定义在部分样本空间的数据点上,而不是整个数据空间,因此新的样本点在嵌入空间中没有对应的投影点,算法的泛化能力不强。
(3)拉普拉斯特征映射算法不能利用流形上某些已知低维信息的数据去学习推测出其它数据的低维信息,扩大流形学习算法的应用范围。
(4)拉普拉斯特征映射方法对邻域选择敏感等存在问题[7]。
(二)局部保持投影算法(LPP)
局部保持投影算法(LPP)[8]是应用于流形学习的降维算法之一,最初为了解决非线性流形学习[9]和分析等领域的相关问题而提出。
LPP可以在不破坏局部邻域关系的前提下进行降维,与其他降维算法相比更能提取出原始人脸图像数据的本质特征,是一种保留了人脸图像空间结构并可以较大程度避免干扰人脸图像识别等诸多因素的降维方法。
这种算法本质上是一种线性降维方法,又由于它充分地利用了拉普拉斯特征映射算法(LE)能够保持原始数据局部邻域关系的优势,将LE算法结合非线性映射的相关知识进行改进,从而能够实现即使对数据进行降维处理后仍能保留数据内部的原始非线性状态,因而克服了线性降维算法的许多缺点和不足。
虽然LPP本质上是一种线性降维方法,同时兼有了流形学习的能力,能够保持高维数据的局部结构,可以获取投影映射,较易获得内嵌低维坐标表示和提取新样本特征。
但是,LPP方法存有如下不足:
(1)LPP容易受到小样本问题的影响;
(2)LPP在投影过程中不能保持数据的全局结构,因为其没有考虑数据的不相邻信息;传统的LPP算法只能提取某些局部的差异,如表情,光照,姿势等,它忽略了不同人间的差异,例如性别,面部形状,种族等。
(3)LPP是一种无监督学习,没有考虑利用实际数据中有用监督信息,指导和重构邻接矩阵[10]。
三、强制性保留算法(WLPP)介绍
在特征提取过程中,传统的LE算法和LPP算法只能提取某些局部的差异,如表情,光照,姿势等,它忽略了不同人间的差异,例如性别,面部形状,种族等。
有学者们希望不同类样本点在低维空间里被映射的尽可能远,并且还能保持同一类样本点的内部几何结构。
为保留样本点之间的结构信息,提出一种强制性WLPP算法,将类间离散度矩阵加入判别信息,用最大化边际准则解决了样本点重叠问题,克服了小样本问题。
具体步骤如下:
定义原始数据集为
X=[x1,,xN
]∈Rm⨯N
,一共有N
个样本,每个样本有
m维,并且每
个样本点分别属于C个类[x1,xc],找到一个转化矩阵A使把高维数据X投影到低维空
Td⨯N
间,得到相应的低维数据Y=(y1,y2,,yN)∈R,这里(d为了保持同一类样本点的内部几何结构,构造如下式子:
Cnc
O=∑∑(yc-yc)2Wc
Wi
c=1i.j=1
jij
(3.1)
这里C为样本类别总数,nc是第c类样本,其中
Y=aTX化简式
(1):
Wc
ij是C类样本之间的权值矩阵。
根据
Cnc
∑∑(yc-yc)2Wc
i
c=1i.j=1
jij
Cnc
=∑∑(aTxc-aTxc)2Wc
i
c=1i.j=1
jij
C⎛ncTc
nc
cTTc
cT⎫
=∑çç∑a
c=1⎝i=1
xiDii(xi)
a-∑a
i.j=1
xiWij(xj)
a⎪⎪
⎭
=aTX(D-W)XTa
=aTXLXTa
(3.2)
Dc=∑Wc
ij
ii
式(3.2)中构造对角矩阵
j。
L=D-W为拉普拉斯矩阵。
WC是相似矩阵。
其
⎡D100⎤
D=⎢0O⎥
⎡W100⎤
W=⎢00⎥
中,⎢⎣0
0DC⎥⎦,
⎢⎣0
0WC⎥⎦。
为了区别不同的样本点,构造全局结构式子:
C
O=∑(m-m)2B
Bi
i.j=1
jij
(3.3)
mi=
i
n
ik
k=1
mj
为第i类均值。
nj
=yi
njk=1
为第j类均值。
(3)式子化简为:
C⎛1nii
2
nj
j
∑ç∑yk-∑yk⎪Bij
ç
i.j=1⎝i
C
k=1
n
njk=1⎪
nj2
⎛1iTi1Tj
=∑ç∑a
xk-
∑axk⎪Bij
ç
i.j=1⎝i
k=1
njk=1⎪
C⎡⎛1ni⎫
⎛1nj
⎫⎤2
=∑⎢aTçç∑xj⎪⎪-aTç∑xj⎪⎥B
i.j=1⎢⎣
⎝ni
k=1⎭
k⎪ij
⎝jk=1⎭⎦
C
T
j
=∑[aTp-a
i
p]Bij
i.j=1
C
=∑aTpE
pT-∑aTpB
pTa
i=1
iiii
C
i.j=1
iijj
=aTPGPTa
(3.4)
同理构造对角矩阵Eii。
令G=E-B使:
WLPP的优化模型可表示为:
Eii=∑Bij
j。
⎛Cnc2C2⎫
min(O
-O)=argminç∑∑(yc-yc)Wc-∑(m-m)B⎪
WBijijijij
⎝c=1i,j=1
i,j=1
⎭(3.5)
将式(3.2)和式(3.4)带入式(3.5)中,可得到目标函数如下:
argmin(aTXLXTa-aTPGPTa)(3.6)化简式(3.6)得到:
argmin(aTVa)
a(3.7)
用拉格朗日对(3.7)式求解得:
λa=Va。
因此特征向量矩阵A=[a1,aN]。
从特征矩阵中选取第2到d+1个特征值对应的特征向量。
即:
A=[a2,ad-1]
四、极端学习机介绍
(一)极端学习机的基本概念
对于N个不同的样本(xj,tj),可表示为X=(x1,x2,,xN)T∈RD⨯N,其中
tj=(tj1,tj2,,tjm)T∈Rm,具有L个隐层节点激活函数为g(x)的ELM[11]模型如下形式:
L
∑βig(ai⋅xj+bi)=tji=1
(4.1)
其中j=1,2,,N,ai=(ai1,ai2,,ain)为连接第i个隐层节点[12]与输入节点的输入权值向量,
βi=(βi1,βi2,,βim)为连接第i个隐层节点与输出节点的输出权值向量,bi为第i个隐层节点的
Tm
偏置值,ai⋅xj表示ai和xj的内积,tj=(tj1,tj2,,tjm)∈R为对应于样本xj的期望输出向量,对所有数据样本进行整合,(4.1)式可以改写为如下形式:
Hβ=T(4.2)
其中H是网络隐层节点输出矩阵,β为输出权值矩阵,T为期望输出矩阵:
⎛g(a1⋅x1+b1)g(aN⋅x1+bN)⎫
H=ç⎪
çg(a1⋅xN+b1)
g(aN⋅xN+bN)⎪
(4.3)
⎛βT⎫
⎛tT⎫⎛t,t⎫
ç1⎪
ç1⎪ç111m⎪
β=ç⎪
T=ç⎪=ç⎪
çβT⎪
çT⎪ç⎪
ç⎪
⎝⎭L⨯m,
çtN⎪
⎝tN1tNm⎭
(4.4)
Huang等人经过无数次实验最终得出了一个结论:
当网络隐层节点的激活函数[13]可达到无穷可微时,网络的偏移量和输入权值可直接随机赋值而不必采用梯度下降算法迭代调整。
因此单隐层神经网络的监督学习过程可利用最小二乘解的方法对(2.2)式进行求解:
^
β=argminHβ-T
2=H+T
β(4.5)
其中H+为矩阵H的广义逆。
为了增强ELM的应用机能并扩大其普适性能,Huang提出了具有等式优化约束条件[14]的ELM,该极端学习机在最小化输出权值β的同时还能最小化训练误差ξ,因此优化的极端学习机目标公式可归纳为:
N
min1β2+1C∑ξi2
W22
i=1
s.t.h(xi)β=tiT-ξiT
i=1,2,,N
(4.6)
(4.6)式中ξi=(ξi1,,ξ1m)T为对应于样本xi的训练误差向量,C为惩罚参数。
在利Lagrange
Multiplier思想时,上述的求解过程即可以当作对无条件最优化问题进行求解。
(二)ELM算法的求解过程
ELM算法求解过程[15]可总结步骤如下:
1)初始化训练样本集;
2)随机指定网络输入权值a和偏置值b;
3)通过激活函数计算隐层节点输出矩阵H;
^
4)计算输出权值,β=H
T(I
C+HH
T)-1
T。
ELM算法如下图4-1:
图4-1ELM求解过程图
五、实验结果及分析
为了证明本文提出的WLPP算法的有效性,有学者们用sigmoid作为统一的激活函数[16]分别在Yale人脸库、YaleB人脸库和ORL人脸库上进行实验。
在每组数据库中分别随机选取每
类样本点的训练个数为trainnum=(3,4,5,6),其余为测试样本。
并且对比了LPP,方法降
到不同维数下的识别率。
不同的数据库参数设置如表5-1所示,所使用的不同人脸库图像如
图5-1所示
表5-1数据集描述
Datasets
Dim
Samples
samples/subject
Classes
Yale
1024
165
11
15
YaleB
1024
2414
55
38
ORL
1024
400
10
40
(a)Yaledatabase
(b)YaleBdatabase
(c)ORLdatabase
图5-1不同人脸图像的训练集
3train(每类训练集个数为3的识别率)4train(每类训练集个数为4的识别率)
5train(每类训练集个数为5的识别率)6train(每类训练集个数为6的识别率)图5-2ELM运用不同降维算法在Yale人脸库识别率曲线
3train(每类训练集个数为3的识别率)4train(每类训练集个数为4的识别率)
5train(每类训练集个数为5的识别率)6train(每类训练集个数为6的识别率)
图5-3ELM运用不同降维算法在YaleB人脸库识别率曲线
3train(每类训练集个数为3的识别率)4train(每类训练集个数为4的识别率)
5train(每类训练集个数为5的识别率)6train(每类训练集个数为6的识别率)
图5-4ELM运用不同降维算法在ORL人脸库识别率曲线
表5-2不同降维算法在Yale人脸库识别率
(平均值±相对误差)%
Algorithms
Umist
3Train
4Train
5Train
6Train
LPP+ELM
42.32±7.20
42.01±3.70
40.74±4.02
40.42±6.24
WLPP+ELM
80.38±19.62
100.00±0
100.00±0
100.00±0
表5-3不同降维算法在YaleB人脸库识别率
(平均值±相对误差)%
Algorithms
Umist
3Train
4Train
5Train
6Train
LPP+ELM
76.73±6.03
77.15±4.80
78.44±4.64
78.57±3.00
WLPP+ELM
100.00±0
100.00±0
100.00±10
100.00±0
表5-4不同降维算法在ORL人脸库识别率
(平均值±相对误差)%
Algorithms
Umist
3Train
4Train
5Train
6Train
LPP+ELM
73.09±7.62
71.50±7.07
71.66±5.84
73.73±7.34
WLPP+ELM
100.00±0
100.00±0
100.00±10
100.00±0
实验分析:
图5-2至5-4分别给出Yale、YaleB及ORL数据集在不同降维算法上的识别率曲线。
表5-2至5-4分别给出Yale、YaleB及ORL的具体识别率以及平均识别率和相对误差。
图5-2至5-4可以看出利用WLPP降维算法明显高于其它算法的识别率曲线,因为
WLPP结合ELM算法充分考虑样本点之间的结构信息,因此图5-3至5-4中WLLP算法的识别率几乎接近于100%,但不会总是100%,因为每次生成结果是随机的,但是比较结果不会改变。
虽然在Yale数据集中每类训练样本个数为4时维度出现的波动较大,但是从表5-2可以看出其识别率仍在90%左右,明显高于LPP算法。
由此实验表明WLPP该算法是十分有效的,同时具有良好的稳定性。
六、展望与总结
综上提出的算法避免了样本点重叠和小样本问题,在采集头像样本方面,可节省一定时间,针对于教学工作的应用,将为学校教学管理提供极大的便利。
同时在分类过程中,不仅提取了人脸表情,光照,姿势等局部特征,又考虑到人的面部形状,性别,种族等类别特征。
由实验结果看出WLPP算法消除了数据包含的冗余属性,降低了能量转化,提高了ELM的泛化性能。
运用此算法,有学者们可将人脸识别技术高效应用于校园管理中去。
本文提出的强制性保留算法(WLPP)虽然在LPP算法的基础上降低了能量转化,提高了ELM的泛化性能,但是
WLPP算法是针对LPP算法的部分缺点进行改进的,并没有考虑到改进后的算法是否影响到
LPP算法原来基本结构或者随之产生其他方面的缺陷。
所以WLPP算法只能是相对LPP算法部分有优势,在大的数据库对比分析下WLPP算法的缺陷就会显现出来,所以通过以后的努力学习,需要去解决出现的问题和更加完善WLPP算法。
同时,日后有学者们会在校园中广泛取样,进行更深层次的实验,试运行阶段过后,才能逐步推广。
科学技术日益发展,人脸识别技术也将在各个不同领域得到广泛应用,在教育领域中亦是如此,将此技术算法应用于教学管理工作中,不仅能够对学生起到一定的监督作用提高学生们的出勤率,还可在一定程度上减缓教职员工的工作量,从而提高学校的总体教学质量,改善总体教学水平,进一步推动教育领域智慧校园理论的发展。