模式识别上机文档格式.docx

资源描述

模式识别上机文档格式.docx

《模式识别上机文档格式.docx》由会员分享，可在线阅读，更多相关《模式识别上机文档格式.docx（13页珍藏版）》请在冰豆网上搜索。

模式识别上机文档格式.docx

或各类出现的先验概率P（ωi）和类条件概率密度函数p（x|ωi）已知

2、两类分类的最小错误率Bayes分类决策规则的后验概率形式：

设N个样本分为两类ω1，ω2。

每个样本抽出n个特征，

x=（x1，x2，x3，…，xn）T

其中，P（ωi|x）为状态后验概率。

由Bayes公式：

两类分类的贝叶斯决策函数：

三实例说明:

一数据集有两类，每个样本有两个特征，类别1（class1.txt文件）含有150个样本，类别2（class2.txt文件）含有250个样本（.txt文件可以直接在Matlab中读入），分别取类别1的前100个和类别2的前200个样本作为训练样本，剩下的作为测试样本。

要求：

（1）根据基于最小错误率的贝叶斯决策理论设计分类器；

（2）叙述实验具体步骤，给出所设计的分类器对训练样本和测试样本的错误率；

（3）提交的作业需包含Matlab程序代码

（4）绘制分类结果（包含决策边界）的图像

1、实验原理

多元正太分布的概率密度函数由下式定义

由最小错误概率判决规则，可得采用如下的函数作为判别函数

这里，

为类别

发生的先验概率，

的类条件概率密度函数，而N为类别数。

设类别

，i=1,2,……,N的类条件概率密度函数

，i=1,2,……,N服从正态分布，即有

，那么上式就可以写为

由于对数函数为单调变化的函数，用上式右端取对数后得到的新的判别函数替代原来的判别函数

不会改变相应分类器的性能。

因此，可取

显然，上式中的第二项与样本所属类别无关，将其从判别函数中消去，不会改变分类结果。

这样，判别函数

可简化为以下形式

2、实验步骤

（1）求出两类样本的均值

（2）求每一类样本的协方差矩阵

式中，l代表样本在类中的序号，其中

代表

类的第l个样本，第j个特征值；

类的

个样品第j个特征的平均值

类的第l个样品，第k个特征值；

个样品第k个特征的平均值。

类的协方差矩阵为

（3）计算出每一类的协方差矩阵的逆矩阵

以及协方差矩阵的行列式

（4）求出每一类的先验概率

（5）将各个数值代入判别函数

判别边界为

3、实验结果

根据matlab的计算结果可得

类别1训练样本的错误率为4%，类别2训练样本的错误率为5%；

类别1测试样本的错误率为6%，类别2训练样本的错误率为4%。

实验图

图1训练样本分类结果

如上图所示，“.”代表类别1的训练样本，“*”代表类别2的训练样本，绿线为决策边界；

图2测试样本分类结果

如上图所示，“.”代表类别1的测试样本，“*”代表类别2的测试样本，绿线为决策边界；

4、实验程序代码

functiong=pattern（x,y）

%clear;

S1=load（'

\lwz\class1.txt'

）;

%原始数据class1导入S1

S2=load（'

\lwz\class2.txt'

%原始数据class2导入S2

fori=1:

100

forj=1:

type1（i,j）=S1（i,j）;

%将class1的前100个数据导入type1当中，作为训练样本

end

200

type2（i,j）=S2（i,j）;

%将class2的前200个数据导入type2当中，作为训练样本

%求训练样本的均值

sumx1=sum（type1,1）;

meanx1=sumx1（1,1）/100;

meany1=sumx1（1,2）/100;

sumx2=sum（type2,1）;

meanx2=sumx2（1,1）/200;

meany2=sumx2（1,2）/200;

%求协方差矩阵

z1（2,2）=0;

z1（1,1）=z1（1,1）+（type1（i,1）-meanx1）^2;

z1（1,2）=z1（1,2）+（type1（i,1）-meanx1）*（type1（i,2）-meany1）;

z1（2,1）=z1（2,1）+（type1（i,2）-meany1）*（type1（i,1）-meanx1）;

z1（2,2）=z1（2,2）+（type1（i,2）-meany1）^2;

z1（1,1）=z1（1,1）/99;

z1（1,2）=z1（1,2）/99;

z1（2,1）=z1（2,1）/99;

z1（2,2）=z1（2,2）/99;

z2（2,2）=0;

z2（1,1）=z2（1,1）+（type2（i,1）-meanx2）^2;

z2（1,2）=z2（1,2）+（type2（i,1）-meanx2）*（type2（i,2）-meany2）;

z2（2,1）=z2（2,1）+（type2（i,2）-meany2）*（type2（i,1）-meanx2）;

z2（2,2）=z2（2,2）+（type2（i,2）-meany2）^2;

z2（1,1）=z2（1,1）/199;

z2（1,2）=z2（1,2）/199;

z2（2,1）=z2（2,1）/199;

z2（2,2）=z2（2,2）/199;

z1_inv=[];

z1_det=[];

z2_det=[];

z1_inv=inv（z1）;

%求协方差矩阵的逆

z2_inv=inv（z2）;

%求协方差矩阵的行列式

z1_det=det（z1）;

z2_det=det（z2）;

%求出两类样本的先验概率

p1=100/300;

p2=200/300;

symsxy;

g=（-0.5）*[x-meanx1,y-meany1]*z1_inv*[x-meanx1;

y-meany1]+log（abs（z1_det））*0.5+log（p1）-（（-0.5）*[x-meanx2,y-meany2]*z2_inv*[x-meanx2;

y-meany2]+log（abs（z2_det））*0.5+log（p2））

%画图命令

ezplot（pattern）;

fori=101:

150

plot（S1（i,1）,S1（i,2）,'

）

holdon

fori=201:

250

plot（S2（i,1）,S2（i,2）,'

End