ImageVerifierCode 换一换
格式:DOCX , 页数:19 ,大小:1.04MB ,
资源ID:1705867      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/1705867.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(模式识别作业.docx)为本站会员(b****2)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

模式识别作业.docx

1、模式识别作业第二章主要内容:几种常见的聚类算法已经所使用的准则函数。作业1:对如下5个6维模式样本,用最小聚类准则进行系统聚类分析已知样本如下:x1: 0, 1, 3, 1, 3, 4;x2: 3, 3, 3, 1, 2, 1;x3: 1, 0, 0, 0, 1, 1;x4: 2, 1, 0, 2, 2, 1;x5: 0, 0, 1, 0, 1, 0第1步:将每一样本看成单独一类,得计算各类之间的欧式距离,可得距离矩阵00000第2步:矩阵中最小元素为,它是和之间的距离,将他们合并为一类,得新的分类为计算聚类后的距离矩阵0000第3步:由于中距离最小者为,它是与之间的距离,于是合并和,得新的分

2、类为同样,按最小距离准则计算距离矩阵,得000第4步:同理得 满足聚类要求,如聚为2类,聚类完毕。系统聚类算法介绍:第一步:设初始模式样本共有N个,每个样本自成一类,即建立N类。G1(0), G2(0) , , GN(0)为计算各类之间的距离(初始时即为各样本间的距离),得到一个N*N维的距离矩阵D(0)。这里,标号(0)表示聚类开始运算前的状态。第二步:假设前一步聚类运算中已求得距离矩阵D(n),n为逐次聚类合并的次数,则求D(n)中的最小元素。如果它是Gi(n)和Gj(n)两类之间的距离,则将Gi(n)和Gj(n)两类合并为一类Gij(n+1),由此建立新的分类:G1(n+1), G2(n

3、+1)第三步:计算合并后新类别之间的距离,得D(n+1)。计算Gij(n+1)与其它没有发生合并的G1(n+1), G2(n+1)之间的距离,可采用多种不同的距离计算准则进行计算。第四步:返回第二步,重复计算及合并,直到得到满意的分类结果。(如:达到所需的聚类数目,或D(n)中的最小分量超过给定阈值D等。)作业2:选k=2,z1(1)=x1, z2(1)=x10,,用K-均值算法进行聚类分析第一步:选取第二步:根据聚类中心进行聚类,得到:第三步:计算新的聚类中心第四步:因,故回到第二步第二步:根据新的聚类中心重新进行聚类,得到:第三步:计算新的聚类中心:第四步:,所以算法收敛,得聚类中心为迭代

4、结束。K-均值算法介绍:算法适用于分类数已知。总的思路如下:选定聚类中心最小聚类准则归类重新计算聚类中心 直到聚类中心不改变为止。 第一步:选K个初始聚类中心,z1(1),z2(1),zK(1),其中括号内的序号为寻找聚类中心的迭代运算的次序号。聚类中心的向量值可任意设定,例如可选开始的K个模式样本的向量值作为初始聚类中心。第二步:逐个将需分类的模式样本x按最小距离准则分配给K个聚类中心中的某一个zj(1)。假设i=j时,则,其中k为迭代运算的次序号,第一次迭代k=1,Sj表示第j个聚类,其聚类中心为zj。第三步:计算各个聚类中心的新的向量值,zj(k+1),j=1,2,K求各聚类域中所包含样

5、本的均值向量:其中Nj为第j个聚类域Sj中所包含的样本个数。以均值向量作为新的聚类中心,可使如下聚类准则函数最小:在这一步中要分别计算K个聚类中的样本均值向量,所以称之为K-均值算法。第四步:若,j=1,2,K,则返回第二步,将模式样本逐个重新分类,重复迭代运算;若,j=1,2,K,则算法收敛,计算结束。 本章其他知识点:1距离相似度测量1.1 欧氏距离 设x和z为两个模式样本,其欧氏距离定义为:D = | x - z |例:x = (x1, x2),z = (z1, z2),则显然,模式x和z之间的距离越小,它们越相似。欧氏距离的概念和习惯上距离的概念是一致的。1.2马氏距离设x是模式向量,

6、m是均值向量,C为模式总体的协方差矩阵,则马氏距离的表达式:1.3一般化的明氏距离模式样本向量xi和xj之间的明氏距离表示为:其中xik和xjk分别表示xi和xj的第k各分量。显然,当m=2时,明氏距离即为欧氏距离。特例:当m=1时,亦称为街坊距离。2角度相似性函数表达式:,它表示模式向量x和z之间夹角的余弦,也称为x的单位向量与z的单位向量之间的点积。特例:当特征的取值仅为(0, 1)两个值时,夹角余弦度量具有特别的含义,即当模式的第i个分量为1时,认为该模式具有第i个特征;当模式的第i个分量为0时,认为该模式无此特征。这时,xTz的值就等于x和z这两个向量共同具有的特征数目。同时,= x中

7、具有的特征数目和z中具有的特征数目的几何平均因此,在特征取值为0和1的二值情况下,S(x, z)等于x和z中具有的共同特征数目的相似性测度。3最大最小距离算法实例10个模式样本点:x1(0 0), x2(3 8), x3(2 2), x4(1 1), x5(5 3), x6(4 8), x7(6 3), x8(5 4), x9(6 4), x10(7 5)算法思路:根据最大最小距离准则,确定聚类数;然后按最近最近距离分类。 第一步:选任意一个模式样本作为第一个聚类中心,如z1 = x1第二步:选距离z1最远的样本作为第二个聚类中心。经计算,| x6 - z1 |最大,所以z2 = x6第三步:

8、逐个计算各模式样本xi, i = 1,2,N与z1, z2之间的距离,即Di1 = | xi - z1 |Di2 = | xi z2 |并选出其中的最小距离min(Di1, Di2),i = 1,2,N第四步:在所有模式样本的最小值中选出最大距离,若该最大值达到|z1 - z2 |的一定比例以上,则相应的样本点取为第三个聚类中心z3,即若maxmin(Di1, Di2), i = 1,2,N |z1 - z2 |,则z3 = xi。否则,若找不到适合要求的样本作为新的聚类中心,则找聚类中心的过程结束。这里,可用试探法取一固定分数,如1/2。在此例中,当i=7时,符合上述条件,故z3 = x7第

9、五步:若有z3存在,则计算maxmin(Di1, Di2, Di3), i = 1,2,N。若该值超过|z1 - z2 |的一定比例,则存在z4,否则找聚类中心的过程结束。在此例中,无z4满足条件。第六步:将模式样本xi, i = 1,2,N按最近距离分到最近的聚类中心:z1 = x1:x1, x3, x4为第一类z2 = x6:x2, x6为第二类z3 = x7:x5, x7, x8, x9, x10为第三类最后,还可在每一类中计算个样本的均值,得到更具代表性的聚类中心。第三章主要内容:如何求判别函数。 第三章作业1:在一个10类的模式识别问题中,有3类单独满足多类情况1,其余的类别满足多类

10、情况2。问该模式识别问题所需判别函数的最少数目是多少?答:将10类问题可看作4类满足多类情况1的问题,可将3类单独满足多类情况1的类找出来,剩下的7类全部划到4类中剩下的一个子类中。再在此子类中,运用多类情况2的判别法则进行分类,此时需要7*(7-1)/2=21个判别函数。故共需要4+21=25个判别函数。第三章作业2:一个三类问题,其判别函数如下: d1(x)=-x1, d2(x)=x1+x2-1, d3(x)=x1-x2-11.设这些函数是在多类情况1条件下确定的,绘出其判别界面和每一个模式类别的区域。2.设为多类情况2,并使:d12(x)= d1(x), d13(x)= d2(x), d

11、23(x)= d3(x)。绘出其判别界面和多类情况2的区域。3.设d1(x), d2(x)和d3(x)是在多类情况3的条件下确定的,绘出其判别界面和每类的区域。答:三种情况分别如下图所示:123第三章作业3:两类模式,每类包括5个3维不同的模式,且良好分布。如果它们是线性可分的,问权向量至少需要几个系数分量?假如要建立二次的多项式判别函数,又至少需要几个系数分量?(设模式的良好分布不因模式变化而改变。)答:(1)若是线性可分的,则权向量至少需要个系数分量;(2)若要建立二次的多项式判别函数,则至少需要个系数分量。第三章作业4:用感知器算法求下列模式分类的解向量w: 1: (0 0 0)T, (

12、1 0 0)T, (1 0 1)T, (1 1 0)T 2: (0 0 1)T, (0 1 1)T, (0 1 0)T, (1 1 1)T解:将属于的训练样本乘以,并写成增广向量的形式迭代选取,则迭代过程中权向量变化如下:;收敛所以最终得到解向量,相应的判别函数为。P.S.迭代过程,或者迭代公式? 第三章作业5:用多类感知器算法求下列模式的判别函数: 1: (-1 -1)T,2: (0 0)T,3: (1 1)T解:采用一般化的感知器算法,将模式样本写成增广形式,即取初始值,取,则有第一次迭代:以为训练样本,故第二次迭代:以为训练样本,故第三次迭代:以为训练样本,故第四次迭代:以为训练样本,故

13、第五次迭代:以为训练样本,故第六次迭代:以为训练样本,故第七次迭代:以为训练样本,故第八次迭代:以为训练样本,故由于第六、七、八次迭代中对均以正确分类,故权向量的解为:,可得三个判别函数为:知识点介绍:多类情况1用线性判别函数将属于i类的模式与不属于i类的模式分开,其判别函数为:i = 1, 2, , M这种情况称为两分法,即把M类多类问题分成M个两类问题,因此共有M个判别函数,对应的判别函数的权向量为wi, i = 1, 2, , M。图例:对一个三类情况,每一类模式可用一个简单的直线判别界面将它与其它类模式分开。例如对的模式,应同时满足:d1(x)0,d2(x)0,d3(x)0的条件超过一

14、个,或全部di(x)0,则重要性质:dij = -dji图例:对一个三类情况,d12(x)=0仅能分开1和2类,不能分开1和3类。要分开M类模式,共需M(M-1)/2个判别函数。不确定区域:若所有dij(x),找不到,dij(x)0的情况。多类情况3(多类情况2的特例)这是没有不确定区域的i/j两分法。假若多类情况2中的dij可分解成:dij(x) = di(x) - dj(x) = (wi wj)Tx,则dij(x)0相当于di(x)dj(x),这时不存在不确定区域。此时,对M类情况应有M个判别函数:即di(x)dj(x),i, j = 1,2,M,则,也可写成,若di(x)=maxdk(x)

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1