1、一、 (15分)设有两类正态分布的样本集,第一类均值为,方差,第二类均值为,方差,先验概率,试求基于最小错误率的贝叶斯决策分界面。解 根据后验概率公式, (2)及正态密度函数 ,。 (2)基于最小错误率的分界面为, (2)两边去对数,并代入密度函数,得 (1) (2)由已知条件可得,(2)设,把已知条件代入式(1),经整理得, (5)二、 (15分)设两类样本的类内离散矩阵分别为, ,各类样本均值分别为,试用fisher准则求其决策面方程,并判断样本的类别。解: (2)投影方向为 (6)阈值为 (4)给定样本的投影为, 属于第二类 (3)三、 (15分)给定如下的训练样例实例x0x1x2t(真
2、实输出)11111212013101-14112-1用感知器训练法则求感知器的权值,设初始化权值为;1 第1次迭代 (4)2 第2次迭代 (2)3 第3和4次迭代 四、 (15分)i. 推导正态分布下的最大似然估计;ii. 根据上步的结论,假设给出如下正态分布下的样本,估计该部分的均值和方差两个参数。1 设样本为K=x1, x2 , xN ,正态密度函数 (2)则似然函数为 (2)对数似然函数 (2)最大似然估计 (2)对于正态分布, (2)2 根据1中的结果, (5)五、 (15分)给定样本数据如下:,(1) 对其进行PCA变换(2) 用(1)的结果对样本数据做一维数据压缩解(1)PCA变换
3、 1 求样本总体均值向量 2 求协方差矩阵 (2) 3求特征根,令,得,。 (1)由,得特征向量, (2)则PCA为, (5) (2)要做一维压缩,就是向最大特征根对应的特征向量做投影,得 , (5)六、 (10分)已知4个二维样本: ,。试用层次聚类把样本分成2类。解:1 初始将每一个样本视为一类,得, 计算各类间的距离,得到距离矩阵,(2)01510050 2 将最短距离1对应的类,合并为一类,得到新的分类: (4) , 计算各类间的欧式距离,得到距离矩阵 (2)0003 将距离最小两类和合并为一类,得到新的分类,聚类结束,结果为 , (2)七、 (10分)已知4个二维样本:,。取K=3,用K均值算法做聚类解:1 K=3,初始化聚类中心, (2)2 根据中心进行分类,得, (2)3 更新聚类中心, (4)4根据新的中心进行分类,得,分类已经不再变化,因此最后的分类结果为, (2)八、 (10分)设论域,给定上的一个模糊关系,其模糊矩阵为 (1) 判断该模糊矩阵式模糊相似矩阵还是模糊等价矩阵(2) 按不同的置信水平给出分类结果解:(1)因为 (计算过程 ),是模糊等价矩阵 (6) (2),聚类结果为 (2) ,聚类结果为 (2)