12第一章 概论.docx
《12第一章 概论.docx》由会员分享,可在线阅读,更多相关《12第一章 概论.docx(17页珍藏版)》请在冰豆网上搜索。
12第一章概论
模式识别PatternRecognition
第一章概论
P.R.的概况
P.R.实例
§1模式识别概论
名词解释:
模式,模式识别
历史与现状
应用领域
方法
与其它学科的关系
1)模式和模式识别
帕夫利笛斯《结构模式识别》:
模式pattern:
供模仿用的完美无缺的标本。
模式识别:
识别出给定物体所模仿的标本。
例如:
粉笔、黑板都是“模式”,见到一个东西,认出这是“粉笔”,而不是“黑板”就是“模式识别”。
人每天都要进行很多次的模式识别,就连最低等的动物都有强的P.R.的能力(生存必要能力),若不能识别食物和敌人,就会灭亡。
研究模式识别的人有两类:
(1)心理学家:
研究人识别事物的过程
(关心感知的数学和生理方面)
(2)搞计算机的:
研究计算机怎样识别模式(本课程的目的)
模式识别精确的讲为:
数字模式识别
计算机模式识别
计算机自动模式识别
模式识别:
使计算机模仿人的感知能力,从感知数据中提取信息(判别物体和行为)的过程。
Patternrecognition
isthestudyofhowmachinescanobservetheenvironment,learntodistinguishpatternsofinterestfromtheirbackground,andmakesoundandreasonabledecisionsaboutthecategoriesofthepatterns.(AnilK.Jain)
◆样本(sample,object):
一类事物的一个具体体现,对具体的个别事物进行观测所得到的某种形式的信号。
◆模式(pattern):
表示一类事物,如印刷体A与手写体A属同一模式。
◆样本是具体的事物,而模式是对同一类事物概念性的概括。
◆模式识别是从样本到类别的映射。
机不如人
计算机的长处是:
计算能力强,而认知能力极弱。
难:
难在无法让计算机精确模拟人的智能。
感知数据:
非结构化(像素、声波等)
为什么研究它?
需要:
(1)生产实践的需要:
需要智能机器人,另外人的工资高,而计算机的价格越来便宜。
(2)信息爆炸现象:
用人来不及处理信息。
如:
卫星遥感,超级市场,邮政,银行,指纹库。
(3)危险地带:
油漆、放射、高温、核电站。
(4)提高工效:
自动化带来的好处已经显而易见。
可能:
计算机的快速发展使得模式识别的研究成为可能。
本课程就是讲用计算机进行分类的各种方法。
(模式识别最狭义的理解)
模式识别的研究一直处在上升阶段,原因在于:
(1)需要;
(2)尚有许多问题还没有解决,有待人们作进一步的研究。
2)应用领域
文字处理:
文字识别(印刷体,手写体汉字识别);
办公自动化(机器翻译);
银行(支票识别);
邮局(邮政信函的自动分拣)。
生物医学:
血细胞计数,染色体分类,心电脑电图,整形外科……
生物特征识别
遥感:
资源普查(对地形地貌的分析,森林资源、海洋资源的普查,湖水面积的计算),地图识别……
工业:
工业机器人——自动装配和自动分拣
语言识别:
说话人,特定人识别
其它:
公安(指纹,人脸),交通(智能交通)
……
3)模式识别的方法
方法多而杂,与应用有很大的关系。
特征提取:
与问题关系很大,且与分类方法有关系,属图像处理范畴。
如:
零件识别:
尺寸,重量,光洁度,硬度
看病诊断:
温度,白血球计数
分类:
(1)启发式:
与具体问题有关,靠抓主要矛盾,靠想象力。
(2)有严格理论基础的方法:
A.统计模式识别——理论成熟(多元统计分析),应用最广,成效显著,本课程的主要内容。
B.结构模式识别——根据目标的结构特征来分类。
主要有句法模式识别——建立在形式语言和自动机理论基础上。
C.模糊模式识别——建立在模糊集(FuzzySet)的理论基础上。
D.其它——如神经网络(NeuralNetwork),支撑向量机(SupportVectorMachine)
与本领域其它学科的关系(交叉、覆盖、联系多)
I.P(S.P)——P.R.——A.I.
C.V.
模式识别以图像处理与信号处理为基础;
模式识别又是人工智能和计算机视觉为基础。
§2P.R.系统举例
1)对航空图片进行统计P.R.
已知:
7谱航空照片(3~10个波段)
地面某些区域的真实情况的信息
要求:
用模式识别的方法对航空照片上其它未知类别的地区进行模式识别以了解这些究竟是什么东西。
利用:
各类物体对不同波长的光反射系数不同。
地里含有水、石、雪,各个波段对其反射系数是不一样的,有:
系统的框图及说明:
1.采集多谱图像(属图像处理范畴),得到:
此例中,地面上每个点用一个7维矢量来表示,这个矢量成为观测矢量。
广义而言,这个矢量是n维的。
观测矢量是模式识别的入口,又称为特征矢量。
所有的特征矢量构成一个n维的空间,这个空间成为特征空间。
特征矢量是特征空间中的一个点,特征矢量的各个分量称为特征。
2.分类(模式识别)就是把特征空间进行划分,观测矢量落在哪个子空间就被分到哪一类中去。
3.特征提取:
此例将不同波长的反射系数作为不同的特征。
4.参数估计:
模式识别分两阶段:
(1)用已知类别的观测矢量(训练样本)对计算机进行训练;
(2)用经过训练的计算机对未知类别的观测矢量进行分类。
5.没有训练样本——聚类clustering。
6.特征选择——抓主要矛盾。
观测矢量的维数可能很高,但不是所有的这些信息对分类有用。
2)句法P.R系统框图
eg.染色体大致有2种:
预处理:
去噪,消光照不均匀,二值化等等。
基元抽取(特征提取):
统计模式识别特征提取得到的是一个向量,而句法模式识别得到的是一个字符串。
句法分析(决策分类):
分析字符串符合哪一个文法,据此来识别输入模式的属于何类。
文法推断(参数估计):
根据大量的训练样本来总结出表示不同类别的字符串的规律,给出对应的文法。
句法模式识别特点:
(1)强调的不是统计特性,而是结构特征。
(2)采用分层结构表示模式,最底层为基元。
(3)句法模式识别是结构模式识别的主流,但远不是全部。
3)手写体汉字识别
难点:
1)字量很大(一级字库3755个字+二级字库3008个字)。
2)结构复杂,有相似的字比较多(土、士,未、末)。
3)随意性强,畸变大。
SR序列:
(统计交叉点个数)
个数
撇
那
竖
横
多交叉点
4交叉点
3交叉点
2交叉点
同字异码
华
0
2
4
2
0
2
1
2
华(没钩)
0
2
3
2
0
2
1
1
同码异字
杏
1
1
3
3
1
0
1
4
呆
1
1
3
3
1
0
1
4
解决同码异字还可:
外接有向图杏呆
结构描述吕回
叉点序列杏呆
这种复杂性决定了模式识别研究的局限性:
数据决定算法
§3课程安排及参考书
教材:
孙即祥:
《现代模式识别》,国防科大出版社
边肇祺:
《模式识别》(第二版),清华大学出版社
参考书:
[1]J.T.Tou(窦祖烈),《PatternRecognitionPrinciples》
[2]福永圭之介,《统计图形识别导论》
[3]张尧庭,方开泰,《多元统计分析导论》
[4]傅京孙,《模式识别及其应用》
[5]Gonzalaz,Thomason,《SyntacticPatternRecognition—anintroduction》
主要期刊
◆IEEETrans.onPAMI(PatternAnalysisMachineIntelligence),1978-,IEEEComputerSociety
◆PatternRecognition,1968-,PRSociety,Elsevier
◆PatternRecognitionLetter,1980-,IAPR,Elsevier
◆MachineLearning,NeuralComputation,IEEETrans.OnNN(NeuralNetwork)
◆Int.JournalofPR(PatternRecognition)andAI(ArtificialIntelligence),1988-(WorldScientific)
◆PatternAnalysisandApplications,1997-(Springer)
◆Int.J.DocumentAnalysis&Recognition,1998-
◆模式识别与人工智能
◆中国图像与图形学学报
主要会议
◆系列性国际会议
ØICCV(InternationalConferenceonComputerVision):
2年一次,1000人规模
ØCVPR(InternationalConferenceonComputerVisionandPatternRecognition):
每年一次在美国,1000人规模
ØECCV(EuropeanConferenceonComputerVision):
2年一次
ICCV,CVPR,ECCV是计算机视觉三大国际会议
ØICPR(InternationalConferenceonPatternRecognition):
2年一次,1000人规模
ØICDAR(InternationalConferenceonDocumentAnalysisandRecognition):
2年一次,300-400人规模
ØFG(IEEEInt’lConferenceonAutomaticFaceandGestureRecognition)
◆其他
ØICASSP(IEEEInternationalConferenceonAcoustics,SpeechandSignalProcessing),
ØICIP(InternationalConferenceonImageProcessing)
ØICML(InternationalConferenceonMachineLearning)
主要组织
◆国际组织
ØIAPR(InternationalAssociationforPatternRecognition,模式识别国际协会)
ØIEEEComputerSociety:
TC(TechnicalCommittee)onPAMI(PatternAnalysisandMachineIntelligence)
◆国内组织
Ø中国自动化学会:
模式识别与机器智能(PRMI)专业委员会,1981年成立,IAPR(InternationalAssociationofPatternRecognition)成员组织
Ø中国计算机学会:
人工智能与模式识别专业委员会
Ø中国人工智能学会
主要机构
◆国外
ØUSA:
MIT(Poggio)
UIUC(UniversityofIllinoisUrbanaChampaign,ThomasHuang)
CMU(CentralMichiganUniversity,T.Kanade)
MSU(MichiganStateUniversity,A.K.Jain)Maryland(Resenfeld,Chellappa)
ØCanada:
Toronto(Hinton),Concordia(C.Y.Suen)
ØUK:
Surrey(Kittler)
MSRCambridge(MicrosoftResearchCambridge,Bishop)
ØFrance:
INRIA(InstitutNationaldeRechercheenInformatiqueetenAutomatique,thefrenchnationalinstituteforresearchincomputerscienceandcontrol)
◆国内
ØMSRA(MicrosoftResearchAsia)
HKUST(HongKongUniversityofScienceandTechnology)
Ø中科院自动化所
清华大学
北京大学
上海交大
西安交大
南京理工大学
武汉大学等
课程进度
第一章:
概论
第二章:
数学基础(统计)
第三章:
用似然函数分类
第四章:
用距离函数分类
第五章:
特征选择
第六章:
句法模式识别