手写体签名的特征提取.docx

资源描述

手写体签名的特征提取.docx

《手写体签名的特征提取.docx》由会员分享，可在线阅读，更多相关《手写体签名的特征提取.docx（16页珍藏版）》请在冰豆网上搜索。

手写体签名的特征提取.docx

手写体签名的特征提取

不同特征提取的手写签名识别方法研究

摘要

引言

在当今社会的各种经济活动中，人们越来越多的用手写签名来代替印章，尤其是在办公自动化、邮政系统等诸多方面的信息处理中。

例如：

各种文书、合同、协议、支票等文件通常要求当事人亲笔签名；各国政府之间的协议和备忘录的签订，官方文件以及法令和法规的颁布，银行支票的签署和汇兑，都需要当事人亲笔签名才能生效。

签名鉴定在国外，尤其是在北美和西欧，是普遍接受的身份辨识方法之一。

在计算机安全领域中，基于人的行为特征的手写签名识别技术具有方便、实用、低成本并符合人的生活习惯等特点，理所当然地受到了广泛的关注。

手写签名识别系统利用计算机自动识别手写签名样本是某个特定人亲自签署的“真签名”还是别人模仿的“伪签名”。

在办公自动化和公共安全方面，签名识别的重要性日益明显，在大多数企业，尤其是经常需要颁布或签署文件的行政部门来说，通过辨识签名的真伪来确定身份的方式易于被人们所接受。

由于签

名识别具有良好的应用前景和巨大的商业价值，世界各国许多学者和研究机构都已表现出极大兴趣，国内近几年也逐步开始了对中文签名认证的研究工作。

1绪论

1.1研究计算机识别签名的目的及意义

手写签名识别系统利用计算机自动识别手写签名样本是某个特定人亲自签

署的“真签名”还是别人模仿的“伪签名”。

由于签

手写字符识别涉及模式识别、图像处理、数字信号处理、自然语言理解、人丁智能、模糊数学、信息论、计算机、中文信息处理等学科，是一门综合性技术，它在中文信息处理、办公室自动化、人工智能等高技术领域，都有着重要的实用价值和理论意义D1。

手写文本、信封、票据表格和签名等的计算机自动阅读都具有十分诱人的应用背景，因此吸引了许多研究者的关注。

手写字符和数字识别技术一旦研究成功并投入应用，将产生巨大的社会和经济效益。

目前，人们在汉字识别领域己经取得了相当的成就，但是由于汉字识别的复杂性，其具体实现一直难以做到速度与效率的完美组合。

日前在国内外，多字体

印刷体字符的识别系统已达到相当高的识别率，不少OCR系统已成为成熟的软件产品。

研究手写体字符识别就是为了使识别系统能够实用化，并可以推广应用

到其他的字符识别领域中去。

由于手写体汉字的随意性和不同汉字间相似性很大，所以识别的难度很大，在整个字符识别领域中，最为困难的就是脱机手写字符的识别。

无约束手写体汉字识别一直是模式识别中的一个热点和难点，到目前

为止，尽管人们在脱机手写英文、汉字识别的研究中已取得很多可喜成就，但距

实用还有一定距离。

手写数字识别这个方向上，经过多年研究，研究工作者己经开始把它向各种实际应用推广。

然而，对于自由手写体汉字识别而言，任重道远，仍需要科研人员不懈的努力，但是不应该就此悲观，随着计算机技术的突飞猛进和人脑功能的进一步揭示，可望在不远的将来发现人脑的识字机理，建立在此基础上手写汉字识别的理论和方法将会有质的飞跃。

1.2签名识别的系统描述

一般情况下，签名识别系统构成如下图。

其中任何一个环节的处理效果的好坏，都会影响到最终的识别结果。

最关键的换就是签名特征提取的设计。

1.3特征提取的基本思路

特征提取是指在原始数据集的基础上，通过变换或组合创建新的特征。

它是对提供的数据集进行变换和组合的操作，它产生的特征较原始数据集对模式具有更明显的区别作用。

在离线签名识别系统中，通过对签名的二维图像进行一定的处理和变换以提取代表该签名的特征，这就是特征提取过程。

在签名识别中，特征的分类方式众多，常用的分类方式把提取的特征分为全局特征、统计特征和形状几何结构特征三类。

具体情况见下表。

表1-1脱机签名特征提取的主要方法

特征类型

具体特征

简要说明

全局特征

签名重心

求签名重心坐标

签名的倾斜特征

签名与水平方向的整体倾斜特征

矩

该特征具有尺度、平

移和旋转不变性

数学变换后得到的系数

利用一些数学变换对签名进行分析，提取特征

统计特征

基于分割的统计特征

签名进行分割后，对得到的每个区域或基元提取统计特征

投影

中心投影，水平或垂直投影

纹理特征

纹理提供了对线性、方向性和周期性等属性的度量，最通用的方法灰度共生矩阵

形状几何结构特征

形状描述子

利用描述子描述签名的轮廓

几何结构特征

通过对签名的几何结构进行量化来反映签名形状结构及笔段的变化

全局特征及整个签名作为特征提取单元，把从整个签名中得到的表征整体特征的参数作为特征。

此类特征具有较强的抗干扰能力，匹配分类方便，速度也较快，但由于对签名细节区分能力弱，对签名的变形敏感，所以一般用于随机和简单伪签名的检测。

统计特征用签名的像素值、特殊点、笔划或笔段的方向及位置分布等统计信息作为特征。

盖雷特征受签名的整体形变影响相对较小，在许多文献中经常使用。

形状几何结构特征既包括签名的全局特征，又包括签名的局部特征，主要表征签名的全局或局部的形状结构特征及相关笔段间的结构关系。

此类特征对签名形变的容忍度最好，而且部分形状几何结构特征还有尺度不变性、平移不变性。

论文就基于MATLAB软件对手写体签名中特征提取进行了分析。

获得的签名数据一般是含有背景或噪音的灰度图像。

预处理阶段主要进行签名定位、去掉签名的背景和签名归一化、去噪等操作。

之后进行特征提取，尽量达到不仅能表达出不同签名者的书写风格，又能容忍来自同一个书写着每次书写时产生的自然差异，即尽可能加大类间距，减小类间距。

特征提取后，签名图像则有一组特征向量来表征。

1.4MATLAB的基本介绍

MATLAB是矩阵实验室（MatrixLaboratory）之意。

除具备卓越的数值计算能力外，它还提供了专业水平的符号计算，文字处理，可视化建模仿真和实时控制等功能。

MATLAB的基本数据单位是矩阵，它的指令表达式与数学，工程中常用的形式十分相似，故用MATLAB来解算问题要比用C，FORTRAN等语言完成相同的事情简捷得多。

当前流行的MATLAB7.0包括拥有数百个内部函数的主包和三十几种工具包（Toolbox）工具包又可以分为功能性工具包和学科工具包。

功能工具包用来扩充MATLAB的符号计算，可视化建模仿真，文字处理及实时控制等功能。

学科工具包是专业性比较强的工具包，控制工具包，信号处理工具包，通信工具包等都

属于此类。

开放性使MATLAB广受用户欢迎.除内部函数外，所有MATLAB主包文件和各种工具包都是可读可修改的文件，用户通过对源程序的修改或加入自己编写程序构造新的专用工具包。

数据获取与预处理

手写签名的随意性较大，又受环境、心情等因素影响，不可避免地出现签名大小、方向等存在一定的差异，而这些差异会影响后续的识别结果。

本文中的预处理就是对签名图像进行位置调整和大小归一，为后面的特征提取与识别奠定基

础。

2.1数据获取

数据采集是指利用某种装置将签名样本的信息转化为离散的数字信息输入计算机。

所采用的数据采集装置根据在识别过程中所采用的信号而定，采集到的

签名样本的质量对于后面的处理过程和识别性能具有重要的影响。

实验所用的样本是用普通钢笔自由书写在打印纸上的。

我们使用的图像输入

设备是microtek扫描仪。

图像扫描仪的扫描精度和所能获取签名信息的大小直接