1、前言模式识别(Pattern Recognition)是人类的一项基本智能,在日常生活中,人们经常在进行“模式识别”。模式识别是一个多领域的交叉学科,它涉及人工智能、统计学、计算机科学、工程学、医学等众多的研究问题。随着2 0世纪4 0年代计算机的出现以及5 0年代人工智能的兴起,模式识别在2 0世纪6 0年代初迅速发展并成为一门新学科。一 、模式与模式识别的概念广义地说,存在于时间和空间中可观察的事物,如果可以区别它们是否相同或相似,都可称之为模式;狭义地说,模式是通过对具体的个别事物进行观测所得到的具有时间和空间分布的信息;把模式所属的类别或同一类中模式的总体称为模式类(或简称为类)。模式
2、识别是指对表征事物或现象的各种形式的(数值的、文字的和逻辑关系的)信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程,是信息科学和人工智能的重要组成部分。模式识别的研究主要集中在两方面,一是研究生物体(包括人)是如何感知对象的,二是在给定的任务下,如何用计算机实现模式识别的理论和方法。前者是生理学家、心理学家、生物学家、神经生理学家的研究内容,属于认知科学的范畴;后者通过数学家、信息学专家和计算机科学工作者近几十年来的努力,已经取得了系统的研究成果。二、模式识别方法统计模式识别方法和结构(句法)模式识别方法把图像或图像系列分割为线条、边缘,结点,区域等并提供相应的特征,诸如灰度
3、值、颜色、形状、纹理,深度等5。目的是要利用这些信息对模式进行分类或者对模式进行分析(描述)。分类是实现一个模式与一个类别号的对应。分析(描述,解释)则是实现一个模式与一个符号描述的对应。模式分析一般包括:解释模式的组成部份,说明各个组成部份的时间和空间关系,甚至给出作出特定解释的理由。1、 用统计方法发展起来的模式识别系统如图一所示。图一 统计模式识别系统在用统计方法研究模式识别问题时,大体上侧重于特征抽取与选择以及模式分类与学习两个方面。(一)特征选择与特征抽取特征选择与特征抽取的一般方法主要分为两种:特征空间变换以及信息和距离的测度。特征空间变换这个方法目的是将原始特征空间变换为较低维数
4、的特征空间,以便于模式的表示与模式的分类。为了压缩特征空间的维数常利用Karhunen-love展开式和主分量分析法。衡量变换结果好坏的标准之一是要看是否增加模式类的可分性。就增加模式类的可分性而言,一般非线性变换比线性变换好。然而就计算复杂性而言,。线性变换要比非线性变换简单得多。(二)分类和学习对模式进行分类和描述是模式识别系统的根本目标。对于每类模式,当已经知道或者虽不确切知道但能精确估计出其特征向量的条件概率密度函数时(亦称类密度函数),就可以导出贝叶斯分类规则,它使平均风险或误识率最小。实际上,当可以得到大量模式样本时,可以比较精确的估计出类密度函数,或者从样本学习到类密度函数。比较
5、实用的非参数分类方案有:最近邻分类规则(NN规则)和K最近邻分类规则(K-NN规则,以及其他种种变态的NN规则。非参数分类方案一般是从样本中直接学习分类规则。对于无人管理的学习,特别是模式的类射数不确切知道时,这时的分类就是集群分析。各种相似性和距离测度都可用作集群划分的准则。集群划分准则和集群参数的选择往往需要探索性地或交互式地进行。2、 运用句法(或结构)方法的模式识别系统的框图如图二所示。图二 句法模式识别系统图中的“基元”类似于统计方法中的特征。在句法方法中。用一个“句子”表示一个模式。句子构成语言语言具有特定的文法。(一)基元选择和基元抽取通常需在基元抽取的复杂性和文法复杂性两者之间
6、折衷,也可以用曲线线段的长度和曲率等表示曲线线段的特征。对于区域范围的模式,一个区域内存在两个特征互异的子区域时称这个区域为边缘,存在着小于一定距离的两个边缘时称这个区域为线,边缘闭合时称为区。常用的特征可以取灰度特征。也可以用形状和纹理测度来描述区域。其他还有一些方法亦可用来描述图像基元,例如灰度矩阵、灰度共生矩阵、梯度共生矩阵、点测度等。 (二)文法文法就是用基元构成模式的规则。文法推断是一个总结由基元构成模式的规律性。从而得到规则即文法的过程,类似于学习。已经有了各种专门的语言来描述特定的模式。例如描述中外文字字符、染色体图像、火花室图像、二维数学化学结构、颈动脉脉冲波形、二维飞机外形、
7、口语单词、指纹图像等。对于多维模式,用多维文法来描述。其他如网状文法(web)、图文法、树文法、形状文法等都已有了应用。有两个因素决定了文法的选择,一个是所选基元的情况,另一个是要权衡文法的描述能力与文法分析的效率。在实际应用中,往往存在某些不确定性。例如测量中的噪声和抖动会引起分割误差和基元抽取误差,从而使描述模式的语言产生二义性。在二义性存在的情况下,可以用随机语言来描述模式。产生随机语言的文法称作随机文法。在随机文法中引进了概串方法,即用具有概率分布的语句来描述模式。(三)句法分析句法分析则是分析输入模式是否符合某种文法规则的过程。也就是分析能否用该文法生成输入模式。分析结果为肯定则对输
8、入模式完成了分类。分析结果为否定,则拒绝输入模式。在选择文法时需考虑文法的描述能力与句法分析复杂性之间的矛盾。同样,在研究句法分析问题时,也应考虑如何从句法分析的角度处理这种矛盾。事实上,要在提高纠错能力和降低分析效率之间进行权衡,实际困难较大。在句法分析中,还可以采用距离或加权距离的方法。这也是一种无人管理的方法。完成集群分析以后,就可以应用文法推断技术来推断每一个群的文法,并构造出相应的句法分析器。三 、模式识别的应用模式识别可用于文字和语音识别、遥感和医学诊断等方面。(一)文字识别字符识别处理的信息可分为两大类:一类是文字信息,处理的主要是用各国家、各民族的文字(如:汉字,英文等)书写或
9、印刷的文本信息,目前在印刷体和联机手写方面技术已趋向成熟,并推出了很多应用系统;另一类是数据信息,主要是由阿拉伯数字及少量特殊符号组成的各种编号和统计数据,如:邮政编码、统计报表、财务报表、银行票据等等,处理这类信息的核心技术是手写数字识别。汉字是历史悠久的中华民族文化的重要结晶,其数量之大,构思之精,为世界文明史所仅有。由于汉字为非字母化、非拼音化的文字,所以在信息技术及计算机技术日益普及的今天,如何将汉字方便、快速地输入到计算机中已成为关系到计算机技术能否在我国真正普及的关键问题。目前,汉字输入主要分为人工键盘输入和机器自动识别输入两种其中人工键入速度慢而且劳动强度大;自动输入又分为汉字识
10、别输入及语音识别输入。从识别技术的难度来说,手写体识别的难度高于印刷体识别,而在手写体识别中,脱机手写体的难度又远远超过了连机手写体识别。到目前为止,除了脱机手写体数字的识别已有实际应用外,汉字等文字的脱机手写体识别还处在实验室阶段。(二)语音识别语音识别技术技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。近年来,在生物识别技术领域中,声纹识别技术以其独特的方便性、经济性和准确性等优势受到世人瞩目,并日益成为人们日常生活和工作中重要且普及的安验证方式。语音识别技术正逐步成为信息技术中人机接口的关键技术,语音技术的应用已经成为一个具有竞争性的新兴高技术
11、产业(三)遥感遥感图像识别已广泛用于农作物估产、资源勘察、气象预报和军事侦察等17。(四)医学诊断在癌细胞检测、X射线照片分析、血液化验、染色体分析、心电图诊断和脑电图诊断等方面,模式识别已取得了成效19。四 、模式识别技术的近乎无限的发展潜力模式识别是一个快速发展和扩散的学科,其在国民经济和国防现代化建设中具有广阔的应用领域和应用前景。随着模式识别理论和技术的发展,其应用领域和实际应用需求也将不断增长。模式识别技术是人工智能的基础技术,2 1世纪是智能化、信息化、计算化、网络化的世纪,在这个以数字计算为特征的世纪里,作为人工智能技术基础学科的模式识别技术,必将获得巨大的发展空间。(一)语音识
12、别技术语音识别技术正逐步成为信息技术中人机接口的关键技术,语音技术的应用已经成为一个具有竞争性的新兴高技术产业。中国互联网中心的市场预测:未来5年,中文语音技术领域将会有超过4 0 0亿人民币的市场容量,然后每年以超过3 0%的速度增长。(二)生物认证技术生物认证技术本世纪最受关注的安全认证技术,它的发展是大势所趋。人们愿意忘掉所有的密码、扔掉所有的磁卡,凭借自身的唯一性来标识身份与保密。国际数据集团(I D C)预测:作为未来的必然发展方向的移动电子商务基础核心技术的生物识别技术在未来1 0年的时间里将达到1 0 0美元的市场规模。(三)数字水印技术9 0年代以来才在国际上开始发展起来的数字
13、水印技术是最具发展潜力与优势的数字媒体版权保护技术。I D C预测,数字水印技术在未来的5年内全球市场容量超过80亿美元。五、 结语经过多年的研究和发展,模式识别技术已广泛被应用于人工智能、计算机工程、机器学、经生物学、医学、侦探学以及高能物理、考古学、地质勘探、宇航科学和武器技术等许多重要领域,模式识别从2 0世纪2 0年代发展至今,并不是要对所有模式识别问题都适用的单一模型和解决识别问题,而是结合具体问题把统计的和句法的识别结合起来,把统计模式识别或句法模式识别与人工智能中的启发式搜索结合起来,把统计模式识别或句法模式识别与支持向量机的机器学习结合起来,把人工神经元网络与各种已有技术以及人工智能中的专家系统、不确定推理方法结合起来,深入掌握各种工具的效能和应有的可能性,互相取长补短,开创模式识别应用的新局面。参考文献:1 边肇祺,张学工. 模式识别(第二版)M. 北京:清华大学出版社,2000-01.2 FU,K.S.The Recent Development of Pattern Recognitions. 1980.3 熊承义.李玉海统计模式识别及其发展现状综述期刊论文-科技进步与对策2003(8).
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1