模式识别jnca.ppt

上传人:b****2 文档编号:2119651 上传时间:2022-10-27 格式:PPT 页数:90 大小:2.67MB
下载 相关 举报
模式识别jnca.ppt_第1页
第1页 / 共90页
模式识别jnca.ppt_第2页
第2页 / 共90页
模式识别jnca.ppt_第3页
第3页 / 共90页
模式识别jnca.ppt_第4页
第4页 / 共90页
模式识别jnca.ppt_第5页
第5页 / 共90页
点击查看更多>>
下载资源
资源描述

模式识别jnca.ppt

《模式识别jnca.ppt》由会员分享,可在线阅读,更多相关《模式识别jnca.ppt(90页珍藏版)》请在冰豆网上搜索。

模式识别jnca.ppt

模式识别1相关学科相关学科教学目标教学目标基本要求基本要求教材教材/参考文献参考文献关于本课程的有关说明2相关学科统计学统计学概率论概率论线性代数(矩阵计算)线性代数(矩阵计算)形式语言形式语言人工智能人工智能图像处理图像处理计算机视觉计算机视觉等等等等3教学目标掌握模式识别的基本概念和方法掌握模式识别的基本概念和方法有效地运用所学知识和方法解决实际问题有效地运用所学知识和方法解决实际问题为研究新的模式识别的理论和方法打下基础为研究新的模式识别的理论和方法打下基础4基本要求基本基本:

完成课程学习,通过考试,获得学分。

完成课程学习,通过考试,获得学分。

提高提高:

能够将所学知识和内容用于课题研究,:

能够将所学知识和内容用于课题研究,解决实际问题。

解决实际问题。

飞跃:

飞跃:

通过模式识别的学习,改进思维方式,通过模式识别的学习,改进思维方式,为将来的工作打好基础,终身受益。

为将来的工作打好基础,终身受益。

5教材教材/参考文献参考文献R.Duda,P.Hart,D.Stork,PatternClassification,secondedition,2000(有中译本).SergiosTheodoridis,KonstantinosKoutroumbas,PatternRecognition,FourthEdition李晶皎等译,模式识别,电子工业出版社。

李晶皎等译,模式识别,电子工业出版社。

孙即祥,现代模式识别,国防科技大学出版社,孙即祥,现代模式识别,国防科技大学出版社,2003年。

年。

边肇祺,张学工,边肇祺,张学工,模式识别模式识别,清华大学出版社。

,清华大学出版社。

6讲授课程内容及安排第一章第一章引论引论第二章第二章聚类分析聚类分析第三章第三章判别域代数界面方程法判别域代数界面方程法第四章第四章统计判决统计判决第五章第五章学习、训练与错误率估计学习、训练与错误率估计第六章第六章最近邻方法最近邻方法第七章第七章特征提取和选择特征提取和选择7第一章引论1.11.1一个模式识别案例及基本概念一个模式识别案例及基本概念1.21.2特征矢量和特征空间特征矢量和特征空间1.31.3随机矢量的描述随机矢量的描述1.41.4正态分布正态分布81.1.1一个模式识别案例一个模式识别案例n识别是人类的基本行为n模式识别(PatternRecognition)使用计算机来辨别事物。

机器识别,计算机识别,机器自动识别。

9人类:

人类:

学习、总结规律,抽象出概念学习、总结规律,抽象出概念机器:

缺乏抽象能力机器:

缺乏抽象能力基本方法是计算基本方法是计算机器与人机器与人类识别事物原理的比事物原理的比较10一个模式识别案例一个模式识别案例n鱼类加工厂需要将传送带上的鱼自动进行分类鲈鱼(Seabass)品种鲑鱼(Salmon)11n问题分析采用摄像机获取图像,根据图像对鱼进行分类。

可能遇到的问题:

n目标的提取预处理n分类的依据特征提取n判别的规则分类器设计12n预处理方便后续操作,同时又不损失关键信息。

n去除噪声n光照调整n目标提取n方向、位置调整n大小规一化在本例中需要采用分割技术将鱼和鱼、鱼和背景分开13n特征提取原始数据量巨大,往往含有很多冗余信息,为了有效实现分类识别,需要对原始数据进行变换,以便得到最能反映分类本质的特征。

可以考虑的特征:

n长度n光泽n宽度n鳍的数目和形状n嘴的位置,等等14n分类根据某种判决规则将被识别对象归为某一类别。

基本方法:

在训练样本集上确定某个判决规则,使按这种判决规则对被识别对象进行分类所造成的错误识别率最小或引起的损失最小。

15n预处理:

去噪,用分割操作把鱼和鱼之间以及鱼和背景之间分开n特征提取和选择:

对单个鱼的信息进行特征选择,从而通过测量某些特征来减少信息量n长度n亮度n宽度n鱼翅的数量和形状n嘴的位置,等等n分类决策:

把特征送入决策分类器1617n采用长度作为特征18n结论单独使用长度错误率太高必须考虑其它特征n改进措施采用光泽度进行新的尝试19n采用光泽度作为特征20n改进:

运用两种特征组和:

光泽度和宽度鱼xT=x1,x2光泽度光泽度宽度宽度设计实例21n采用光泽度和宽度作为特征22n我们可以尝试增加其他特征,但必须注意两点:

新增特征与已有特征不相关不会引起性能的下降n我们还可以改进分类器模型,达到如下图所示的效果:

2324n讨论:

这样的效果好吗?

设计实例25n讨论我们的目标是使所设计的分类器能够正确识别未知样本-泛化能力过分复杂的判决边界,过分关注某些特定的训练样本,而忽略了类别的共同特征,导致泛化能力弱!

26n决策边界过于复杂导致的问题n运算量大n数学表达困难n泛化能力差:

对未知样本的分类错误率高27n理想状况:

对训练样本的分类性能和分界面复杂度的折中28n面向特定任务的分类系统及错误分类(误判)的代价(损失)n如果两种错误代价相同,则以最小错误率为准则;n如果两种错误代价不等,则以最小风险为准则。

可以调整阈值边界,确定最优的分界点。

n确定某种决策规则,使得决策所引起的损失最小,这是决策理论的核心任务。

29n采用光泽度作为特征,考虑误判代价301.1.2模式识别的基本概念模式识别的基本概念n模式识别模式识别(PatternRecognition)(PatternRecognition):

确定一个确定一个样本的类别属性(模式类)的过程,即把某一样本的类别属性(模式类)的过程,即把某一样本归属于多个类型中的某个类型。

样本归属于多个类型中的某个类型。

n样本(样本(Sample)Sample):

一个具体的研究(客观)对象。

一个具体的研究(客观)对象。

如一条鱼、患者,某人写的一个汉字,一幅图片如一条鱼、患者,某人写的一个汉字,一幅图片等。

等。

31n特征特征(Features)(Features):

能描述模式特性的量(测能描述模式特性的量(测量值)。

在统计模式识别方法中,通常用一量值)。

在统计模式识别方法中,通常用一个矢量个矢量表示,称之为特征矢量,记为表示,称之为特征矢量,记为n模式模式(Pattern)(Pattern):

对客体(研究对象)特征的描对客体(研究对象)特征的描述(定量的或结构的描述),是取自客观世界述(定量的或结构的描述),是取自客观世界的某一样本的测量值的集合(或综合)。

的某一样本的测量值的集合(或综合)。

n模式类模式类(Class)(Class):

具有某些共同特性的模式的具有某些共同特性的模式的集合。

集合。

32模式识别系统的主要环节:

模式识别系统的主要环节:

特征提取:

特征提取:

对重要特征量测,形成特征矢量对重要特征量测,形成特征矢量或将对象分解为基元,或将对象分解为基元,符号化,形成符号串或关系图符号化,形成符号串或关系图特征选择:

特征选择:

选择有代表性的特征,能够正确分类选择有代表性的特征,能够正确分类学习和训练:

学习和训练:

利用已知样本建立分类和识别规则利用已知样本建立分类和识别规则分类识别:

分类识别:

对所获得样本按建立的分类规则进行分对所获得样本按建立的分类规则进行分类识别类识别33模式识别的学习、训练方法n有监督学习有监督学习(有教师学习):

有一个已知样本集(有一个已知样本集(集合中每个样本的类别已知),作为作为训练样本集,并通过挖掘先验已知信息来指导设计分类器。

n无监督学习无监督学习(无教师学习):

没有已知类别标签的训练数据可用,通过挖掘样本中潜在的相似性分类;34模式识别系统数据采集数据采集特征提取特征提取二次特征二次特征提取与选择提取与选择分类分类识别识别待识待识对象对象识别结果识别结果通常在采集信息过程中,还要去除所获取信息通常在采集信息过程中,还要去除所获取信息中的噪声,增强有用的信息等工作。

这种使信息中的噪声,增强有用的信息等工作。

这种使信息纯化的处理过程叫做信息的纯化的处理过程叫做信息的预处理预处理。

分类识别是根据事先确定的分类识别是根据事先确定的分类规则分类规则对前面选取对前面选取的特征进行的特征进行分类分类(即识别)。

(即识别)。

通常能描述对象的元素很多,为节约资源和提通常能描述对象的元素很多,为节约资源和提高处理速度,有时更为了可行性,在满足分类识高处理速度,有时更为了可行性,在满足分类识别正确率要求的条件下,按某种准则尽量选用对别正确率要求的条件下,按某种准则尽量选用对正确分类识别作用较大的特征。

使得用较少的特正确分类识别作用较大的特征。

使得用较少的特征就能完成分类识别任务。

征就能完成分类识别任务。

预处理预处理这个环节的内容很广泛,与要解决的具这个环节的内容很广泛,与要解决的具体问题有关,例如,从体问题有关,例如,从图象图象中将中将汽车车牌汽车车牌的号码的号码识别识别出来,就需要先将出来,就需要先将车牌车牌从从图像图像中找出来,再中找出来,再对对车牌车牌进行进行划分划分,将每个,将每个数字数字分别分别划分划分开。

做到开。

做到这一步以后,才能对每个这一步以后,才能对每个数字数字进行进行识别识别。

以上工。

以上工作都应该在预处理阶段完成。

作都应该在预处理阶段完成。

数字化数字化比特流比特流35模式识别系统数据采集数据采集特征提取特征提取二次特征二次特征提取与选择提取与选择分类分类识别识别待识待识对象对象识别结果识别结果数据采集数据采集特征提取特征提取可改进规则可改进规则的分类识别的分类识别二次特征提二次特征提取与选择取与选择训练训练样本样本改进采集改进采集提取方法提取方法改进特征提改进特征提取与选择取与选择制定改进分制定改进分类识别规则类识别规则人工人工干预干预正确率正确率测试测试36对象空间对象空间模式空间模式空间特征空间特征空间类型空间类型空间各类空间(各类空间(Space)Space)的概念的概念模式采集:

模式采集:

从客观世界(对象从客观世界(对象空间)到模式空间的过程称为空间)到模式空间的过程称为模式采集。

模式采集。

特征提取和特征选择:

特征提取和特征选择:

由模式由模式空间到特征空间的变换和选择。

空间到特征空间的变换和选择。

类型判别:

类型判别:

特征空间到类型空特征空间到类型空间所作的操作。

间所作的操作。

模模式式识识别别三三大大任任务务37纸币识别器对纸币按面额进行分类纸币识别器对纸币按面额进行分类面额面额系统实例5元10元20元50元100元38系统实例长度长度(mm)(mm)宽度宽度(mm)(mm)55元元13613663631010元元14114170702020元元14614670705050元元1511517070100100元元156156777739系统实例磁性磁性金属条位置金属条位置(大约大约)55元元有有54/8254/821010元元有有54/8754/872020元元有有57/8957/895050元元有有60/9160/91100100元元有有63/9363/93405元10元20元50元100元12345678反反射射光光波波形形41系统实例数据采集、特征提取:

数据采集、特征提取:

长度、宽度、磁性、磁性的位置,光反射亮度、光长度、宽度、磁性、磁性的位置,光反射亮度、光透射亮度等等透射亮度等等特征选择:

特征选择:

长度、磁性及位置、反射亮度长度、磁性及位置、反射亮度分类识别:

分类识别:

确定纸币的面额及真伪确定纸币的面额及真伪42模式识别的其他例子模式识别的其他例子计算机自动诊断疾病计算机自动诊断疾病:

1.1.获取情况获取情况(信息采集信息采集)2.2.测量体温、血压、心率、血液化验、测量体温、血压、心率、血液化验、XX光透光透射、射、BB超、心电图、超、心电图、CTCT等尽可能多的信息,并将等尽可能多的信息,并将这些信息数字化后输入电脑。

这些信息数字化后输入电脑。

特征要进行选择特征要进行选择。

3.3.22运行在电脑中的运行在电脑中的专家系统专家系统或专用程序可以分或专用程序可以分析这些数据并进行析这些数据并进行分类分类,得出正常或不正常的,得出正常或不正常的判断,不正常情况还

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 经管营销 > 财务管理

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1