模式识别真题精选Word文件下载.docx
《模式识别真题精选Word文件下载.docx》由会员分享,可在线阅读,更多相关《模式识别真题精选Word文件下载.docx(29页珍藏版)》请在冰豆网上搜索。
先验概率未知的
[多项选择题]
7、影响聚类算法结果的主要因素有()。
A. 已知类别的样本质量
B. 分类准则
C. 特征选取
D. 模式相似性测度
B,C,D
8、影响基本K-均值算法的主要因素有()。
A. 样本输入顺序
B. 模式相似性测度
C. 聚类准则
D. 初始类中心的选取
A,B,D
9、在统计模式分类问题中,当先验概率未知时,可以使用()。
A. 最小损失准则
B. 最小最大损失准则
C. 最小误判概率准则
D. N-P判决
B,D
[单项选择题]
10、散度是根据()构造的可分性判据。
A. 先验概率
B. 后验概率
C. 类概率密度
D. 信息熵
E. 几何距离
C
11、如果以特征向量的相关系数作为模式相似性测度,则影响聚类算法结果的主要因素有()。
A.已知类别样本质量
B.分类准则
C.特征选取
D.量纲
12、欧式距离具有()
A.平移不变性
B.旋转不变性
C.尺度缩放不变性
D.不受量纲影响的特性
A,B
13、马式距离具有()。
A,B,C,D
14、聚类分析算法属于();
判别域代数界面方程法属于() 。
A. 无监督分类
B. 有监督分类
C. 统计模式识别方法
D. 句法模式识别方法
A,C
15试问“模式”与“模式类”的含义。
如果一位姓王的先生是位老年人,试问“王先生”和“老头”谁是模式,谁是模式类?
在模式识别学科中,就“模式”与“模式类”而言,模式类是一类事物的代表,概念或典型,而“模式”则是某一事物的具体体现,如“老头”是模式类,而王先生则是“模式”是“老头”的具体化。
16试说明用监督学习与非监督学习两种方法对道路图像中道路区域的划分的基本做法,以说明这两种学习方法的定义与它们间的区别。
监督学习方法用来对数据实现分类,分类规则通过训练获得。
该训练集由带分类号的数据集组成,因此监督学习方法的训练过程是离线的。
非监督学习方法不需要单独的离线训练过程,也没有带分类号(标号)的训练数据集,一般用来对数据集进行分析,如聚类,确定其分布的主分量等。
就道路图像的分割而言,监督学习方法则先在训练用图像中获取道路象素与非道路象素集,进行分类器设计,然后用所设计的分类器对道路图像进行分割。
使用非监督学习方法,则依据道路路面象素与非道路象素之间的聚类分析进行聚类运算,以实现道路图像的分割。
17试述动态聚类与分级聚类这两种方法的原理与不同。
动态聚类是指对当前聚类通过迭代运算改善聚类;
分级聚类则是将样本个体,按相似度标准合并,随着相似度要求的降低实现合并。
18试列举线性分类器中最著名的三种最佳准则以及它们各自的原理。
线性分类器三种最优准则:
F.isher准则:
根据两类样本一般类内密集,类间分离的特点,寻找线性分类器最佳的法线向量方向,使两类样本在该方向上的投影满足类内尽可能密集,类间尽可能分开。
这种度量通过类内离散矩阵Sw和类间离散矩阵Sb实现。
感知准则函数:
准则函数以使错分类样本到分界面距离之和最小为原则。
其优点是通过错分类样本提供的信息对分类器函数进行修正,这种准则是人工神经元网络多层感知器的基础。
支持向量机:
基本思想是在两类线性可分条件下,所设计的分类器界面使两类之间的间隔为最大,它的基本出发点是使期望泛化风险尽可能小。
19对一副道路图像,希望把道路部分划分出来,可以采用以下两种方法:
1.在该图像中分别在道路部分与非道路部分画出一个窗口,把在这两个窗口中的象素数据作为训练集,用Fisher准则方法求得分类器参数,再用该分类器对整幅图进行分类。
2.将整幅图的每个象素的属性记录在一张数据表中,然后用某种方法将这些数据按它们的自然分布状况划分成两类。
因此每个象素就分别得到相应的类别号,从而实现了道路图像的分割。
试问以上两种方法哪一种是监督学习,哪个是非监督学习?
第一种方法中标记了两类样本的标号,需要人手工干预训练过程,属于监督学习方法;
第二种方法只是依照数据的自然分布,把它们划分成两类,属于非监督学习方法。
20试分析五种常用决策规则思想方法的异同。
五种常用决策是:
1. 基于最小错误率的贝叶斯决策,利用概率论中的贝叶斯公式,得出使得错误率最小的分类规则。
2. 基于最小风险的贝叶斯决策,引入了损失函数,得出使决策风险最小的分类。
当在0-1损失函数条件下,基于最小风险的贝叶斯决策变成基于最小错误率的贝叶斯决策。
3. 在限定一类错误率条件下使另一类错误率最小的两类别决策。
4. 最大最小决策:
类先验概率未知,考察先验概率变化对错误率的影响,找出使最小贝叶斯奉献最大的先验概率,以这种最坏情况设计分类器。
5. 序贯分类方法,除了考虑分类造成的损失外,还考虑特征获取造成的代价,先用一部分特征分类,然后逐步加入性特征以减少分类损失,同时平衡总的损失,以求得最有效益。
21既然有线性判别函数,为什么还要引进非线性判别函数?
试分析由“线性判别函数”向“非线性判别函数”推广的思想和方法。
实际中有很多模式识别问题并不是线性可分的,这时就需要采用非线性分类器,比如当两类样本分不具有多峰性质并互相交错时,简单的线性判别函数往往会带来较大的分类错误。
这时,树分类器作为一种分段线性分类器,常常能有效地应用于这种情况。
更多内容请访问《睦霖题库》微信公众号
22什么是Fisher线性判别?
可以考虑把d维空间的样本投影到一条直线上,形成一维空间,即把维数压缩到一维,这在数学上容易办到,然而,即使样本在d维空间里形成若干紧凑的互相分得开的集群,如果把它们投影到一条任意的直线上,也可能使得几类样本混在一起而变得无法识别。
但是在一般情况下,总可以找到某个方向,使得在这个方向的直线上,样本的投影能分开得最好。
问题是如何根据实际情况找到这条最好的、最易于分类的投影线,这就是Fisher算法所要解决的基本问题。
23写出两类和多类情况下最小风险贝叶斯决策判别函数和决策面方程。
24请论述模式识别系统的主要组成部分及其设计流程,并简述各组成部分中常用方法的主要思想。
信息获取:
通过测量、采样和量化,可以用矩阵或向量表示二维图像或波形。
预处理:
去除噪声,加强有用的信息,并对输入测量仪器或其他因素造成的退化现象进行复原。
特征选择和提取:
为了有效地实现分类识别,就要对原始数据进行变换,得到最能反映分类本质的特征。
分类决策:
在特征空间中用统计方法把识别对象归为某一类。
25设两个家庭,每家3-5人,选每个人的一张照片,共8张,混放在一起,将照片两两对照,得出描述其“相似程度”的模糊关系矩阵。
要求按相似程度聚类,希望把二个家庭分开。
26监督学习与非监督学习的区别。
27线性分类器三种最优准则。
F.isher准则:
根据两类样本一般类内密集, 类间分离的特点,寻找线性分类器最佳的法线向量方向,使两类样本在该方向上的投影满足类内尽可能密集,类间尽可能分开。
该种度量通过类内离散矩阵Sw和类间离散矩阵Sb实现。
28试说明以下问题求解是基于监督学习或是非监督学习:
1.求数据集的主分量2.汉字识别3.自组织特征映射4.CT图像的分割
1、求数据集的主分量是非监督学习方法;
2、汉字识别对待识别字符加上相应类别号——有监督学习方法;
3、自组织特征映射——将高维数组按保留近似度向低维映射——非监督学习;
4、CT图像分割——按数据自然分布聚类——非监督学习方法;
29什么是模式及模式识别?
模式识别的应用领域主要有哪些?
模式:
存在于时间,空间中可观察的事物,具有时间或空间分布的信息;
模式识别:
用计算机实现人对各种事物或现象的分析,描述,判断,识别。
模式识别的应用领域:
(1)字符识别;
(2)医疗诊断;
(3)遥感;
(4)指纹识别 脸形识别;
(5)检测污染分析,大气,水源,环境监测;
(6)自动检测;
(7)语声识别,机器翻译,电话号码自动查询,侦听,机器故障判断;
(8)军事应用。
30模式识别系统的基本组成是什么?
(1)信息的获取:
是通过传感器,将光或声音等信息转化为电信息;
(2)预处理:
包括A/D,二值化,图象的平滑,变换,增强,恢复,滤波等,主要指图象处理;
(3)特征抽取和选择:
在测量空间的原始数据通过变换获得在特征空间最能反映分类本质的特征;
(4)分类器设计:
分类器设计的主要功能是通过训练确定判决规则,使按此类判决规则分类时,错误率最低。
把这些判决规则建成标准库;
(5)分类决策:
在特征空间中对被识别对象进行分类。
31模式识别的基本问题有哪些?
(1)模式(样本)表示方法:
(a)向量表示;
(b)矩阵表示;
(c)几何表示;
(4)基元(链码)表示;
(2)模式类的紧致性:
模式识别的要求:
满足紧致集,才能很好地分类;
如果不满足紧致集,就要采取变换的方法,满足紧致集。
(3)相似与分类;
(a)两个样本xi,xj之间的相似度量满足以下要求:
①应为非负值②样本本身相似性度量应最大③度量应满足对称性④在满足紧致性的条件下,相似性应该是点间距离的单调函数
(4)特征的生成:
特征包括:
(a)低层特征;
(b)中层特征;
(c)高层特征
(5)数据的标准化:
(a)极差标准化;
(b)方差标准化
32什么是模式空间及加权空间,解向量及解区?
33超平面的四个基本性质是什么?
34二分法能力如何表示?
35广义线性判别方法。
36什么是参数估计,非参数估计,监督学习,无监督学习?
参数估计:
先假定研究的问题具有某种数学模型,如正态分布,二项分布,再用已知类别的学习样本估计里面的参数;
非参数估计:
不假定数学模型,直接用已知类别的学习样本的先验知识直接估计数学模型;
监督学习:
在已知类别样本指导下的学习和训练,参数估计和非参数估计都属于监督学习。
无监督学习:
不知道样本类别,只知道样本的某些信息去估计,如:
聚类分析。
37最大似然估计算法思想:
准则,求解过程。
38贝叶斯估计算法思想:
准则,求解过程
39分类与聚类的区别是什么?
分类:
用已知类别的样本训练集来设计分类器(监督学习);
聚类(集群):
用事先不知样本的类别,而利用样本的先验知识来构造分类器(无监督学习)。
40简述聚合聚类(系统聚类)的算法
41动态聚类的算法(K-均值算法)
①先选定某种距离作为样本间的相似性的度量;
②确定评价聚类结果的准则函数;
③给出某种初始分类,用迭代法找出使准则函数取极值的最好的聚类结果。
42什么是模糊集,α-水平截集?
43什么是模糊集的并,交,补运算?
44什么是相似关系,等价关系?
A.相似关系:
具有自反性对称性的模糊关系称为相似关系(或类似关系);
B.等价关系:
具有自反性、对称性、传递性的模糊关系称为等价关系。
45隶属原则识别法的基本思想。
46择近原则识别法的基本思想
47在一个10类的模式识别问题中,有3类单独满足多类情况1,其余的类别满足多类情况2。
问该模式识别问题所需判别函数的最少数目是多少?
将10类问题可看作4类满足多类情况1的问题,可将3类单独满足多类情况1的类找出来,剩下的7类全部划到4类中剩下的一个子类中。
再在此子类中,运用多类情况2的判别法则进行分类,此时需要7*(7-1)/2=21个判别函数。
故共需要4+21=25个判别函数。
48一个三类问题,其判别函数如下:
d1(x)=-x1,d2(x)=x1+x2-1,d3(x)=x1-x2-1设这些函数是在多类情况1条件下确定的,绘出其判别界面和每一个模式类别的区域。
49一个三类问题,其判别函数如下:
d1(x)=-x1,d2(x)=x1+x2-1,d3(x)=x1-x2-1设为多类情况2,并使:
d12(x)=d1(x),d13(x)=d2(x),d23(x)=d3(x)。
绘出其判别界面和多类情况2的区域。
50一个三类问题,其判别函数如下:
d1(x)=-x1,d2(x)=x1+x2-1,d3(x)=x1-x2-1设d1(x),d2(x)和d3(x)是在多类情况3的条件下确定的,绘出其判别界面和每类的区域。
51用感知器算法求下列模式分类的解向量w:
ω1:
{(0 0 0)T,(1 0 0)T,(1 0 1)T,(1 1 0)T} ω2:
{(0 0 1)T,(0 1 1)T,(0 1 0)T,(1 1 1)T}
52用多类感知器算法求下列模式的判别函数:
(-1 -1)T,ω2:
(0 0)T,ω3:
(1 1)T
53采用梯度法和准则函数:
式中实数b〉0,试导出两类模式的分类算法。
54用LMSE算法求下列模式的解向量:
写出模式的增广矩阵X:
55用二次埃尔米特多项式的势函数算法求解以下模式的分类问题:
{(0 1)T,(0 -1)T} ω2:
{(1 0)T,(-1 0)T}
56用下列势函数:
求解以下模式的分类问题:
ω1:
{(0 1)T,(0 -1)T} ω2:
57试说明Mahalanobis距离平方的定义,到某点的Mahalanobis距离平方为常数的轨迹的几何意义,它与欧氏距离的区别与联系
58已知一组数据的协方差矩阵为
,试问:
求该数组的两个主分量。
59已知一组数据的协方差矩阵为
主分量分析或称K-L变换,它的最佳准则是什么?
K-L变换的最佳准则为:
对一组数据进行按一组正交基分解,在只取相同数量分量的条件下,以均方误差计算截尾误差最小。
60已知一组数据的协方差矩阵为
为什么说经主分量分析后,消除了各分量之间的相关性。
在经主分量分解后,协方差矩阵成为对角矩阵,因而各主分量间相关性消除。