基于自由形态生物行为特征的移动设备身份验证方法研究.docx

上传人:b****3 文档编号:24722475 上传时间:2023-05-31 格式:DOCX 页数:19 大小:620.21KB
下载 相关 举报
基于自由形态生物行为特征的移动设备身份验证方法研究.docx_第1页
第1页 / 共19页
基于自由形态生物行为特征的移动设备身份验证方法研究.docx_第2页
第2页 / 共19页
基于自由形态生物行为特征的移动设备身份验证方法研究.docx_第3页
第3页 / 共19页
基于自由形态生物行为特征的移动设备身份验证方法研究.docx_第4页
第4页 / 共19页
基于自由形态生物行为特征的移动设备身份验证方法研究.docx_第5页
第5页 / 共19页
点击查看更多>>
下载资源
资源描述

基于自由形态生物行为特征的移动设备身份验证方法研究.docx

《基于自由形态生物行为特征的移动设备身份验证方法研究.docx》由会员分享,可在线阅读,更多相关《基于自由形态生物行为特征的移动设备身份验证方法研究.docx(19页珍藏版)》请在冰豆网上搜索。

基于自由形态生物行为特征的移动设备身份验证方法研究.docx

基于自由形态生物行为特征的移动设备身份验证方法研究

基于自由形态生物行为特征的移动设备身份验证方法研究

(文章总体不够详细,篇幅仍需要扩充,主要先扩充篇幅才行,至于细小语句,等大体出来了再细改吧?

实验数据贴上,实验到现在没有做完?

数据太少。

篇幅不够,核心内容部分不够突出,而且好像没有按照上次发的那样改)

摘要

第一句话,写研究的意义和背景;第2句话写,针对什么。

的问题,本文提出一种什么方法,,该方法的步骤是什么?

或者功能。

第三句话,本方法的效果是?

就是实验结果。

关键字

一、介绍

随着手机等大量智能设备的广泛流行,设备访问控制和数据安全问题日益显得重要。

据最新报告,到2015年全球将会有6.4亿台平板电脑各15亿智能手机在同时被使用。

然而,目前手机用户身份验证技术一些局限性。

例如,大多数设备只提供登录密码来保证安全,一天下来用户需要多次输入密码,用户体验下降,密码一旦泄漏,造成的后果不想而知。

另一方面,如果用户设置密码比较复杂,就容易出现密码被遗忘的情况,这将导致合法用户无法正常使用手机及其应用,这将给用户造成极大的不便,甚至是不可挽回的损失【3】。

因此,在登录以后还需要一个智能持续的验证手段以确保用户信息安全。

明确的身份验证机制(如密码)不适合于持续验证,因为这样会大大降低用户体验。

综上所述,我们迫切需要一种更为有效的身份认证方式。

这种身份认证方式必须具有简单易用、安全可靠、不易被窃取等特点。

基于生物行为特征的身份认证就是这样一种认证技术,而由于智能手机的资源受限性和便携性,当前常用的几种生物特征身份认证方式应用于智能手机上时或多或少存在些问题。

于是,本文提出一种基于自由形态生物行为特征手势的持续身份认证方法。

经过调查,我们发现最令人满意的用户信息验证方式应该是一种能够在后台进行,不会打断用户的正常操作的验证方式。

当然,出于性能和费用的关系,创造出一种新型用户验证体系完全取代现在的移动安全系统是不实际的。

我们的目标是通过机器学习来分析用户使用设备的习惯实现一种持续,隐式,智能的身份验证手4段对当前移动安全系统进行完善。

【10】

二、相关工作:

关于生物技术的识别方案,特征提取方案,安全性问题。

2D手势识别方案:

和自由形态的手势类似,biometric-rich身份验证方案是基于当前用户对触摸屏的手势,从而提取特征,唯一的标识他们【1】。

弗兰克掩饰了用户和智能手机的监护组建了用户的唯一标识符【2】。

他们显示了用户进行简单的动作例如滚动阅读,滑动到下个页面时额方式具有独特性例如滑动的坐标,加速度,时间,手指压力,一根手指覆盖的区域面积,震动,旋转等等都可以被用来进行分【4】]。

安全性方面通过好多方法进行了分析,通过攻击者复制最初的生物特征的或者图案密码,但由于手势很难被复制【5】,所以本文没有分析手势内容的安全性。

3D手势识别方案:

最近大多数用基于摄像机系统【6】或者用基于无线电信号【7】的系统。

其中,摄像头系统是,一个使用者在空中做出手势,图像被处理成为一个二位空间的图像用于记忆,而无线信号方法,则从测量wifi信号的接受和传送的多普勒效应中记忆三维手势。

以前以手势作为身份验证方法都集中在两个主要方向:

一个是在普通环境和在例如笔迹运动检测,由无线信号预定义的全身姿态,基于内置传感器的移动设备的运动检测的特殊环境下,同样的姿势是否能够被正确识别【2,4】。

手势安全的研究致力于特定场景的姿态保护和一个安全的间接测量标准。

此外这些工作主要致力于参与者对于模板手势重复的记忆理解的表现情况【7】【8】。

我们的目标是让用户不需要记忆特定的手势形状,根据每个人唯一性的生物行为特征通过机器学习的方法构建一个针对单独用户的独特的模板,通过自由形态的手势从多个生物特征角度识别出当前用户的角色。

但是在识别的过程中,可以提取的特征变量非常多,数据维数很高,数据量相当大,而通常情况下并不是每个变量都包含了独立的信息,因此大量冗余的特征不仅增加了计算的复杂度,而且会干扰识别的精确性。

实际上每种事物都有自己的独特的特征,反映这种性质的特征就决定了相似性,是区别某一事物和其他事物的标志,也是识别和分类的关键。

因此,如何从众多的特征中找出那些对识别和分类最有效的特征就变得尤为重要,这就是模式识别中最为核心的问题之一,特征提取。

【25】

记忆生物特征密码的安全性分析:

大多数分析致力于防止图案密码或者手势遭受肩窥攻击。

实现方案依赖于技术使输入更难以被攻击例如令图案画过之后所画的轨迹消失。

还有个小组设计了基于Rubine的一个算法来告诉使用者是否他们使用的手势过于简单,虽然这是基于识别器上的得分能力,而不是手势本身。

Schaub说手势密码空间的尺度应取决于三个方面:

设计特点(用户怎样与设备进行交互);智能手机的本身性能(触摸屏大小,传感器等等);密码特性(安全性,可用性)。

安全性在这里就是指对肩窥的有原则的抵制。

继续安全分析方面的内容,手势的暴力破解已经在一些研究中被提到。

Zhao提出当用户在一个图案中画出2D手势的时候抵制暴力破解的方案【8】。

通过用户将要画图案的区域,可以猜测出密码,这个研究并不关注手势做出时的安全性而是专注于在一个基于图片的识别方案(不是自由形态的手势验证)中用户在什么地方进行验证。

Serwadda方案提出基于生物分析的验证方案密码可以被机器人通过一个提供滑动输入统计数据的算法进行蛮力破解这个叫做字典攻击。

【9】【27】

三:

模型架构

对这个图的执行顺序解释下。

具体我们的工作集中于数据采集,提取和选择特征(提取和降维),用优化的数据进行训练分类,认证,减少能耗,和安全性验证等方面。

3.1数据采集及预处理:

根据智能设备的特点,我们对每个样本收集提取尽可能多的特征包括:

操作,位置,时间,轨迹长度,压力变化,接触面积,速度,加速度,陀螺仪,app等等。

每组数据采集后存储为一个数组向量,提取p个样本数据后组建样本矩阵,第i个样本的样本矩阵为:

xi={ai,bi,ci,di,ei,….}。

xi是一个p维的向量。

同时定义此样本的分类标记为yi,yi的值根据样本是不是来自用户本人,如果是则为1,否则则为0.

于是我们对于n个样本可以提取样本矩阵:

X(n*p)和分类标记矩阵Y(n*1)。

对样本数据进行预处理,数据的标准化是将数据按比例缩放,使之落入一个小的特定区间。

在某些比较和评价的指标处理中经常会用到,去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。

本文采用数据预处理方法是z-score。

归一化的目的是为了把不同来源的数据统一到一个参考系下,这样比较起来才有意义。

我所采用的就是z-score标准化的方法,又叫座标准差标准化,经其处理的数据符合标准正态分布,即均值为零,标准差为1。

转化函数为x’=(x-u)/σ,其中u为所有样本数据的均值,σ为样本的标准差。

我们选择z-score标准化的理由是其得到的标准化样本更符合统计学规律,并有利于简化后面进一步的处理。

根据公式我们可以得到标准化后的样本矩阵X’。

3.2特征的提取和选择

不同类别的物体由于性质的不同,在各种特征方面的表现也不同,因此,最能区分不同性质的特征,也就是最能反映分类本质的特征,对识别和分类最有效。

特征提取的任务就是求出一组相互独立,即不相关的特征,这组特征能使分类性能达到最佳,即使得类间距离较大的同时类内距离较小,且特征的维数尽可能的低。

在原始的正中包含着大量复杂的信息成分,主要包括三大部分:

(1)那些确实有效的特征信息。

这类特征能明确反映类别的属性,是成功分类的重要信息;

(2)相互重叠的特征信息这些特征所反映的类别属性之间不是独立,互补的,可能会相互影响,相互作用,存在多重的连续相关性,这些信息可能会引起分类识别的误差;

(3)与类别属性完全无关的特征信息。

显然这类特征没有任何意义,而且可能会增加计算量,引入噪声等。

【23】

特征提取的目标就是找出第一部分的特征达到降维和去噪的效果【18】。

假设已有N维特征向量空间Y={y1,y2,….,yN},特征提取就是找到一个映射关系:

A:

Y---X,使新样本特征描述维度低于原来维数,其中每个分量xi原特征向量各分量的函数。

映射后的综合性特征成为二次特征。

二次特征更本质,更利于识别。

一直以来研究者们对特征提取理论和方法做了许多研究,提出很多有效的算法,从映射的角度可以分为线性和非线性:

对原始特征进行线性变换成为线性特征提取,得到的是线性特征;对原始特征进行非线性变换称为非线性特征提取,得到的是非线性特征。

典型的线性算法有主成分分析(PCA)方法,Fisher线性鉴别分析(LDA)方法。

非线性方法:

核主成分分析(KPCA)和核Fisher鉴别分析(KFDA)。

这些方法对一个数据集进行变换来提取特征。

近年来很多研究者将精力放在研究两个数据集的关系上,并将其用在线性提取方面,典型的如:

典型相关分析方法,偏最小二乘方法(PLS)等。

偏最小二乘方法综合了多元线性回归分析,主成分分析和典型相关分析三者的基本功能,其便捷、鲁棒性、强预测性好,在处理高位小样本为提上有一定的优势。

偏最小二乘约=多元线性回归分析+主成分分析+典型相关分析;【18】

下面对PLS的将为方法进行简要介绍:

定义x是m维的样本特征向量,y表示移位的分类标记,令样本的数量为n。

PLS将矩阵X(n*m)和向量y(n*1)分解为:

其中T和U是n*p维的包含p维潜在主要成分的矩阵。

P和q分别表示m*p维和1*p维的矩阵和向量,称为载荷。

N*m维的矩阵E和n*1的向量f表示残差。

NIPALS通过构建一组权重向量(投影向量)W={w1,w2,w3,…wp},定义如下:

其中ti是矩阵的第i行,ui是矩阵U的第i行cov(ti,ui)表示协方差。

数据降维十九通过将样本特征向量vi投影到权重向量W={w1,w2,w3,w4……..wp}之上。

3.3训练分类

随着机器学习技术的不断发展,用于训练分类的算法很多,主要有,基于最近邻算法的量角器算法;基于类似于大脑神经突触联接的结构进行处理的数学模型;统计模型中的隐马尔科夫模型(HMM);起源于语音识别领域的动态时间规划算法(DWT)还有支持向量机算法(SVM)我们本文采用改进的SVM的方法。

SVM方法以非线性映射作为其理论基础,利用内积函数代替向高维空间进行非线性映射。

以最大化分类边际思想为核心,致力于求取特征空间划分的最优超平面【16】。

这个地方吧改进的改进的SVM的方法写上,数学公式和伪代码,(这个是核心部分)

改进型SVM实现的具体步骤如下:

第一步:

寻找最优间隔分类器:

即通过最大化训练样本的几何间隔,得出一个最优分类的超平面,

式1

其中γ表示几何间隔,y表示预测结果,x表示训练数据,ω、b表示引入的超平面参数。

化简上式可以得到一个二次函数:

式2

第二步:

通过拉格朗日对偶法求解:

首先为了避免当样例线性不可分时所产生的误差,这里引入软间隔方法

式3

C是离群点的权重,C越大表明离群点对目标函数影响越大,ξ表示松弛变量,即允许某些样本点的函数间隔小于1。

然后构造拉格朗日方程:

式4

对方程求解可得:

式5

第三步:

核函数替换

核函数这里使用高斯核函数,由于它能够把原始特征映射到无穷维,将原本线性不可分的样本在高维空间里变得线性可分,能够实现非常好的分类效果。

式6

用高斯核函数代替式5中的,就可以实现可函数替换向高维映射的效果。

第四步:

SMO优化算法

SMO算法实质是重复选取参数a,使得每个参数都满足拉格朗日条件。

要求解的朗格朗日结果式为:

式7

然后通过启发式选择,选择偏离KKT条件最大得参数,对其优化,使满足:

式8

求出所有参数a之后,可以解出参数b:

式9

至此超平面的参数已经求出,可以利用该分类器对接下来的输入样本X进行预测。

SVM实现伪代码:

之后再借鉴adaboost算法,对不同的训练集训练同一个基本分类器(弱分类器),然后把这些在不同训练上得到的分类器集合起来,构成一个更强的最终分类器(强分类器)【23】。

理论证明,只要每个弱分类器分类能力比随机猜测要好,当其个数趋向于无穷个时,强分类器的错误率将趋于零。

不同的训练集是通过调整每个样本对应的权重来实现的。

本文的训练分类步骤如下:

第一步:

在一部分样本集分布下训练出一个分类器h1(x),对于h1(x)错分的样本增加其权重。

同时根据h1(x)的错分数目赋予h1(x)一个权重q1表示该基本分类器的重要程度,错分越少q1越大;

第二步,把提高权重的分错的样本和新的样本结合构成新的样本集,再次训练得到基本分类器h2(x)及其权重q2。

如此循环得到T个基本分类器H(x),以及T个对应的权重Q,最后把T个分类器按权重累加,得到了最终所期望的强分类器。

3.4识别和持续认证策略

根据系统的设计,手势识别策略分为以下几个步骤:

(整理为伪代码,不要直接贴代码上去,像这样的写法)

 

1、待识别样本x按z-score标准化方法得到标准化样本向量x’。

2、把标准化的样本向量x’输入到基本分类器得到各个分类器的结果P。

3、将分类结果P和各个基本分类器的权重值Q相乘后相加作为强分类器的分类依据k;

4、将k与人为设定的阈值u相比较,如果k>u,则认证通过,否则认证失败。

伪代码表述:

input:

example,threshold

output:

result

for(i=0,score=0;i

Score+=classifier_i()*classfier_weight_i

if(score>threshold)

Result=true;

elseResult=false;

持续认证策略:

针对生物特征手势识别的特点提出一种方案:

当长时间保持好的检测结果的保证下关闭传感器,根据使用者的社会角色,制定什么时候打开的策略。

具体的过程是:

设定一个可信值参数True,表明“当前使用者是本人“的这一结果的可信度,随着每隔一段时间的一次识别,每识别正确一次,对可信值有一个贡献值in,每识别错误减去减益值re,当值其达到一定值high的时候,关闭系统的识别,并随着时间的推移这个,可信值变小,当小到另一个阈值open的时候重新开启识别系统。

当低于一个更小的阈值false的时候,触发隐私保护模块。

其中三个阈值的大小关系是:

high>open>false。

显然这是一个持续性的工作,即使攻击者偶尔输入的手势与模板吻合,也是处于于一种高危险的状态。

只有本人使用时才可以使手机保持长期稳定的安全状态。

写成伪代码方式。

这个好转换呀。

(整理为伪代码,不要直接贴代码上去,像这样的写法)

 

3.5手势库动态更新策略

实际上,随着使用者一直使用设备,其习惯即生物行为特征也是在慢慢的变化的,相应的识别系统中所用的模板也需要“与时俱进”。

然而SVM分类器并不存在模版更新的机制。

因此,针对本系统的特点,我们提出一种模板更新的策略,灵感来自于背景建模中的编码本算法。

在上面的说明中我们使用了Svm分类器和adaboost思想结合使用的策略。

每个弱分类器都有一个初始的权重值Q表明其识别能力。

在使用者使用的过程中,通过统计一个弱分类器hi(x)的识别的正确率,来修改初始参数qi。

当这个参数小于一个thre的时候,去除这个弱分类器,并使用最近时间中用户产生并被正确分类的样本数据训练出一个新的弱分类器来取代这个分类器,使弱分类器的数目维持在一定的水平保证对手势分类的正确性。

这种方法从整体上来说更新了手势模板,加入了使用者最近习惯的变化因素。

四、安全性验证:

传统身份认证方案如数字密码,图案密码的失败原因大致有以下几个方面:

1、肩窥攻击,肩窥是指攻击者试图通过视线来记住一个密码。

2、暴力破解,暴力破解是通过反复尝试密码,以找到正确的那个【8】。

3、字典攻击,字典攻击类似蛮力攻击但不同的是,密码尝试来自于一组更可能的数据集(如用户研究数据集)。

字典攻击已经被证明有对手势密码的攻击。

机器人被建立在基于人类参与者在智能手机上进行手势输入的训练数据之上。

在样本人群中,该机器人能够成功地破解至少一半的手势【9】。

4、存储泄漏,存储泄漏可能是一个问题,在于该手势密码是否被存储在设备上。

成功地窃取,根据存储数据的手势。

根据以上各种攻击的特点。

由于认证模板的建立过程中采集了不同的各个特征,包括,位置,持续时间,压力变化,接触面积,速度,加速度,陀螺仪等,使通过肩窥攻击仅用视线观测来通过认证成为不可能。

加上这种认证手段本质上并没有明确的密码,似的暴力破解也显得很无力。

安全隐患主要来自于字典攻击和存储泄露。

然而,字典攻击依赖于一个简化编辑的假设,即触摸屏设备不会多次不成功的尝试后锁定。

这个也很好解决,只需制定一个认证不通过就锁定的策略使机器人手机不了足够的样本,进行手势的破解。

最后存储泄露的问题,可以使用特定的算法进行加密,算法体现在程序运行的过程中,即使通过内存找到了手势模板的信息,也不知道怎样把信息转化为模板。

【10】

综上所述,对于最普遍的肩窥和暴力破解方法对基于生物行为特征的手势验证方案来说在原理上几乎不可能。

对于比较高级,少见的破解方法如字典攻击,存储泄露也有比较好的防范方法

五、实验部分

实验设计:

找7名参与者,分别收集每个参与者五百次划屛手势数据,数据内容包括位置,时间,轨迹长度,压力变化,接触面积,速度,加速度,陀螺仪等等,从而得到十个特征集记作x1,x2,…,x7。

其中位置信息是取整个轨迹的端点和三个四等分点共5个点的坐标。

压力变化,接触面积,速度,加速度也是每个位置都进行一次测量。

最后得到的特征向量维数为33。

收集信息后,过两个星期的时间,再让这7名实验者来对分类器的效果进行手机信息,结果如下:

5.1采用不同特征提取比较

验证不进行特征提取和用什么方法特征提取对实验结果精度的影响,以一个参与者的样本库为正样本,其他的为负样本,进行训练结果如下:

方法:

主成分分析方法(PCA):

偏最小二乘法(PLS):

实验数据分析和结论:

从数据上可以看出使用特征提取和选择,在拥有相同准确率的基础上可以明显的减少特征向量的维度,并且准确率的准确度上限有所提高。

因此我们可以得出结论:

采用特征提取明显的达到了,去除噪声,减少计算时间,提高识别准确性的目的。

实验二、根据上面实验的结果,选取表现最好的PLS特征提取方法得到的特征进行训练,比较不同分类器的对实验结果精度的影响。

其中隐马尔科夫模型,DWT,高斯SVM以一个参与者的样本库为正样本,其他的为负样本,进行训练得到一个分类器;SVM+adaboost以一个参与者的样本库为正样本,每次随机从另外的6个样本集中平均选取共500个为负样本进行训练,最终得到6个分类器构成的联合分类器分类器。

按照结果如下:

为避免算法对数据的依赖性,分别以一个数据集为正样本其他为负样本进行七次实验取七次实验的最好分类的一次和最差的一次,结果如下:

实验数据分析和结论:

通过实验数据可以看出,,,,,,,,,,,,

七、创新点和今后工作

本文主要的创新点是提出了基于生物行为特征的身份验证方案,另外采用了基于SVM和adaboost结合的模式识别方法并提出了基于此方法的模版更新策略,并通过特征提取去除了原始数据中的无关干扰因素,减少了数据维数;以后工作:

1、减少过程中产生的能耗;2、采用诸如多线程的方法或者更好策略,减少数据的计算时间,提高认证速度。

通过结合【】【】的研究成果和本文的讨论和实验证明,基于自由形态生物行为特征的移动身份认证方法可以有效的用于身份验证。

参考文献:

[1]C.Bo,L.Zhang,X.-Y.Li,Q.Huang,andY.Wang.Silentsense:

Silentuseridentificationviatouchandmovementbehavioralbiometrics.InProc.ofMobiCom’13.

[2]M.Frank,R.Biedert,E.Ma,I.Martinovic,andD.Song.Touchalytics:

Ontheapplicabilityoftouchscreeninputasabehavioralbiometricforcontinuousauthentication.IEEETrans.onInformationForensicsandSecurity,Jan2013.

[3]TaoFeng,JunYang,ZhixianYan.TIPS:

Context-AwareImplicitUserIdentificationusingTouchScreeninUncontrolledEnvironments,Mar2014

[4]N.Sae-Bae,K.Ahmed,K.Isbister,andN.Memon.Biometric-richgestures:

anovelapproachtoauthenticationonmulti-touchdevices.InProc.ofCHI’12.

[5]MichaelShermany,GradeighClarky,YulongYangy,ShridattSugrimy,ArttuModig_,JanneLindqvisty,AnttiOulasvirtaz,TeemuRoos,User-GeneratedFree-FormGesturesforAuthentication:

SecurityandMemorability,Dec.2013.

[6]J.Tian,C.Qu,W.Xu,andS.Wang.Kinwrite:

Handwriting-basedauthenticationusingkinect.InProc.ofNDSS’13.

[7]Q.Pu,S.Gupta,S.Gollakota,andS.Patel.Whole-homegesturerecognitionusingwirelesssignals.InProc.ofMobiCom’13.

[8]Z.ZhaoandG.-J.Ahn.Onthesecurityofpicturegestureauthentication.InProc.ofUSENIXSecurity’13.

[9]I.Jermyn,A.Mayer,F.Monrose,M.K.Reiter,andA.D.Rubin.Thedesignandanalysisofgraphicalpasswords.InProc.ofSSYM’99.

[10]ChengBo,LanZhang†,Xiang-YangLi,SilentSense:

SilentUserIdentificationviaDynamicsofTouchandMovementBehavioralBiometricsAug2013

[11]D.FlorencioandC.Herley.Alarge-scalestudyofwebpasswordhabits.InProc.ofWWW’07.

[12]M.Frank,R.Biedert,E

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > IT计算机

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1