模式识别试题库文档格式.docx
《模式识别试题库文档格式.docx》由会员分享,可在线阅读,更多相关《模式识别试题库文档格式.docx(20页珍藏版)》请在冰豆网上搜索。
1.7感知器算法。
(1)只适用于线性可分的情况;
(2)线性可分、不可分都适用。
1.8积累位势函数法的判别界面一般为。
(1)线性界面;
(2)非线性界面。
1.9基于距离的类别可分性判据有:
。
(1)
(2)(3)
1.10作为统计判别问题的模式分类,在()情况下,可使用聂曼-皮尔逊判决准则。
1.11确定性模式非线形分类的势函数法中,位势函数K(x,xk)与积累位势函数K(x)的关系为()。
1.12用作确定性模式非线形分类的势函数法,通常,两个n维向量x和xk的函数K(x,xk)若同时满足下列三个条件,都可作为势函数。
①();
②();
③K(x,xk)是光滑函数,且是x和xk之间距离的单调下降函数。
1.13散度Jij越大,说明ωi类模式与ωj类模式的分布()。
当ωi类模式与ωj类模式的分布相同时,Jij=()。
1.14若用Parzen窗法估计模式的类概率密度函数,窗口尺寸h1过小可能产生的问题是(),h1过大可能产生的问题是()。
1.15信息熵可以作为一种可分性判据的原因是:
1.16作为统计判别问题的模式分类,在()条件下,最小损失判决规则与最小错误判决规则是等价的。
1.17随机变量l()=p(|ω1)/p(|ω2),l()又称似然比,则E{l()|ω2}=()。
在最小误判概率准则下,对数似然比Bayes判决规则为( )。
1.18影响类概率密度估计质量的最重要因素是()。
1.19基于熵的可分性判据定义为,JH越(),说明模式的可分性越强。
当P(ωi|)=()(i=1,2,…,c)时,JH取极大值。
1.20Kn近邻元法较之于Parzen窗法的优势在于()。
上述两种算法的共同弱点主要是()。
1.21已知有限状态自动机Af=(∑,Q,δ,q0,F),∑={0,1};
Q={q0,q1};
δ:
δ(q0,0)=q1,δ(q0,1)=q1,δ(q1,0)=q0,δ(q1,1)=q0;
q0=q0;
F={q0}。
现有输入字符串:
(a)00011101011,(b)1100110011,(c)101100111000,(d)0010011,试问,用Af对上述字符串进行分类的结果为()。
1.22句法模式识别中模式描述方法有:
(1)符号串
(2)树(3)图(4)特征向量
1.23设集合X={a,b,c,d}上的关系,R={(a,a),(a,b),(a,d),(b,b),(b,a),(b,d),(c,c),(d,d),(d,a),(d,b)},则a,b,c,d生成的R等价类分别为([a]R=,[b]R=,[c]R=,[d]R=)。
1.24如果集合X上的关系R是传递的、()和()的,则称R是一个等价关系。
1.25一个模式识别系统由那几部分组成?
画出其原理框图。
1.26统计模式识别中,模式是如何描述的。
1.27简述随机矢量之间的统计关系:
不相关,正交,独立的定义及它们之间的关系。
1.28试证明,对于正态分布,不相关与独立是等价的。
1.29试证明,多元正态随机矢量的线性变换仍为多元正态随机矢量。
1.30试证明,多元正态随机矢量的分量的线性组合是一正态随机变量。
第二部分分析、证明、计算题
第二章聚类分析
2.1影响聚类结果的主要因素有那些?
2.2马氏距离有那些优点?
2.3如果各模式类呈现链状分布,衡量其类间距离用最小距离还是用最大距离?
为什么?
2.4动态聚类算法较之于简单聚类算法的改进之处何在?
层次聚类算法是动态聚类算法吗?
比较层次聚类算法与c-均值算法的优劣。
2.5ISODATA算法较之于c-均值算法的优势何在?
2.6简述最小张树算法的优点。
2.7证明马氏距离是平移不变的、非奇异线性变换不变的。
2.8设,类、的重心分别为、,它们分别有样本、个。
将和合并为,则有个样本。
另一类的重心为。
试证明与的距离平方是
2.9
(1)设有M类模式ωi,i=1,2,...,M,试证明总体散布矩阵ST是总类内散布矩阵SW与类间散布矩阵SB之和,即ST=SW+SB。
(2)设有二维样本:
x1=(-1,0)T,x2=(0,-1)T,x3=(0,0)T,x4=(2,0)T和x5=(0,2)T。
试选用一种合适的方法进行一维特征特征提取yi=WTxi。
要求求出变换矩阵W,并求出变换结果yi,(i=1,2,3,4,5)。
(3)根据
(2)特征提取后的一维特征,选用一种合适的聚类算法将这些样本分为两类,要求每类样本个数不少于两个,并写出聚类过程。
2.10
(1)试给出c-均值算法的算法流程图;
(2)试证明c-均值算法可使误差平方和准则最小。
其中,k是迭代次数;
是的样本均值。
2.11现有2k+1个一维样本,其中k个样本在x=-2处重合,另k个样本在x=0处重合,只有1个在x=a>
0处。
若a=2(k+1),证明,使误差平方和准则Jc最小的两类划分是x=0处的k个样本与x=a处的1个样本为一类,其余为另一类。
这里,
cNj
Jc=∑∑(xi-mj)2
j=1i=1
其中,c为类别数,Nj是第j类的样本个数,xi∈ωj,i=1,2,...,Nj,mj是第j类的样本均值。
2.12有样本集,试用谱系聚类算法对其分类。
2.13设有样本集S=,证明类心到S中各样本点距离平方和为最小时,有。
2.14假设s为模式矢量集X上的距离相似侧度,有且当时,。
证明d是距离差异性测度。
2.15证明欧氏距离满足旋转不变性。
提示:
运用Minkowski不等式,对于两矢量和,满足
2.16证明:
(a)如果s是类X上的距离相似侧度,,那么对于,也是类X上的距离测度。
(b)如果d是类X上的距离差异性测度,那么对于,也是类X上的距离差异性测度
2.17假设是连续单调递增函数,满足
d是类X上的距离差异性测度且。
证明也是类X上的距离差异性测度。
2.18假设s为类X上的距离相似侧度,有,是连续单调递增函数,满足
证明是X上的距离相似侧度。
2.19证明:
对于模式矢量集X上任意两个矢量和有
2.20(a)证明公式中的最大最小值分别是和。
(b)证明当时,公式中
2.21假设d是模式矢量集X上的差异性测度,是相应相似测度。
证明
其中和是分别根据s和d所定义的。
的定义来自于下面公式,其中第一个集合只含有一个矢量。
平均亲近函数
,其中和分别是集合和的势。
即使是测度,显然不是测度。
在公式中,和中的所有矢量都参与计算。
2.22假设。
证明。
2.23考虑一维空间的两矢量,和,,定义距离为
这个距离曾被提议作为欧氏距离的近似值。
(a)证明是距离。
(b)比较和的计算复杂度。
2.24若定义下列准则函数
其中是中个样本的均值向量,是总散布矩阵,
(1)证明对数据的非奇异线形变换具有不变性。
(2)证明把中的样本转移到中去,则使改变为
(3)写出使最小化的迭代程序。
2.25证明对于C-均值算法,聚类准则函数满足使算法收敛的条件。
(即若,则有)
2.26令是点到聚类的相似性度量,式中和是聚类的均值和协方差矩阵,若把一点从转移到中去,计算由公式
所示的变化值。
第三章判别域代数界面方程法
3.1证明感知器算法在训练模式是线性可分的情况下,经过有限次迭代后可以收敛到正确的解矢量。
3.2
(1)试给出LMSE算法(H-K算法)的算法流程图;
(2)试证明X#e(k)=0,这里,X#是伪逆矩阵;
e(k)为第k次迭代的误差向量;
(3)已知两类模式样本ω1:
x1=(-1,0)T,x2=(1,0)T;
ω2:
x3=(0,0)T,x4=(0,-1)T。
试用LMSE算法判断其线性可分性。
3.3设等式方程组,其中:
属于的样本作为的前行,属于的样本作为的后行。
证明:
当余量矢量时,MSE解等价于Fisher解。
3.4已知二维样本:
=(-1,0)T,=(0,-1)T,=(0,0)T,=(2,0)T和=(0,2)T,,。
试用感知器算法求出分类决策函数,并判断=(1,1)T属于哪一类?
3.4.已知模式样本x1=(0,0)T,x2=(1,0)T,x3=(-1,1)T分别属于三个模式类别,即,x1∈ω1,x2∈ω2,x3∈ω3,
(1)试用感知器算法求判别函数gi(x),使之满足,若xi∈ωi则gi(x)>
0,i=1,2,3;
(2)求出相应的判决界面方程,并画出解区域的示意图。
给定校正增量因子C=1,初始值可以取:
w1
(1)=(4,-9,-4)T,w2
(1)=(4,1,-4,)T,w3
(1)=(-4,-1,-6)T。
3.5已知ω1:
{(0,0)T},ω2:
{(1,1)T},ω3:
{(-1,1)T}。
用感知器算法求该三类问题的判别函数,并画出解区域。
3.6试证明:
(1)从到超平面的距离是在的约束条件下,使达到极小的解。
(2)在超平面上的投影是。
3.7设有一维空间二次判别函数,试将其映射成广义齐次线性判别函数。
3.8对二维线性判别函数
(1)将判别函数写成的形式,并画出的几何图形;
(2)将其映射成广义齐次线性判别函数;
(3)指出上述X空间实际是Y空间的一个子空间,且对X子空间的划分与原空间中对原X空间的划分相同,并在图上表示出来。
3.9指出在Fisher线性判别中,的比例因子对Fisher判别结果无影响的原因。
3.10证明两向量外积组成的矩阵一般是奇异的。
3.11证明,在几何上,感知器准则函数值正比于被错分类样本到决策面的距离之和。
3.12解释为什么感知器函数是一个连续分段的线性分类器。
3.13如果在感知器算法中,那么在步之后,这个算法收敛,其中,。
3.14证明感知器算法的正确分类和错误分类在有限个反复的运算以后是收敛的
3.15考虑一种情况,在类中包含两个特征向量,。
类中包含和两个向量。
根据感知器算法,其中,,设计一个线性分离器来区分这两类
3.16在上一章2。
12问题中两分类问题中,取,,.对于每一类产生50个向量。
为了确保对于这两类的线性分离,对于向量[1,1]类确保,
对于[0,0]向量类。
下面的步骤就是使用这些向量去设计一个线性分类器使用(3.21)中的感知器算法。
在收敛以后,画出相关的判定线
3.17假如2.12问题中是多类分类问题,每一类有100个样本点。
根据LMS算法使用这些数据去设计一个线性分类器。
当所有的点被带入这个算法中进行计算的时候,画出这个算法收敛的相关超平面。
其中,然后使用。
观察这个结果
3.18证明,使用KESLER