第九讲模糊模式识别.docx

资源描述

第九讲模糊模式识别.docx

《第九讲模糊模式识别.docx》由会员分享，可在线阅读，更多相关《第九讲模糊模式识别.docx（17页珍藏版）》请在冰豆网上搜索。

第九讲模糊模式识别.docx

第九讲模糊模式识别

一、模糊数学的基础知识

模糊数学又称为“模糊集理论”，是在康托尔（GeorgCantor）的经典集合理论基础上发展起来的。

1、集合及其特征函数：

（1）集合：

在经典集合理论中，集合可以用来说明概念，它是具有某种共同属性的事物的全体，即论域E中具有性质P的元素组成的总体称为集合。

（2）集合的运算：

集合的常用运算包括：

交（∩）、并（∪）、补

（3）特征函数：

对于论域E上的集合A和元素x，如有以下函数：

特征函数表达了元素x对集合A的隶属程度

可以用集合来表达各种概念的精确数学定义和各种事物的性质

2、模糊集合

（1）概念的模糊性：

许多概念集合具有模糊性，例如：

成绩：

好、差

身高：

高、矮

年龄：

年轻、年老

头发：

秃、不秃

（2）隶属度函数：

如果一个集合的特征函数μA（x）不是{0,1}二值取值，而是在闭区间[0，1]中取值，则μA（x）是表示一个对象x隶属于集合A的程度的函数，称为隶属度函数。

隶属度函数一般来源于对概念模糊程度的统计调查和专家经验总结，常见的隶属度函数形式有：

a）三角形：

b）梯形：

c）高斯形：

d）柯西形：

模糊数学的本质

模糊数学不是把精确的概念模糊化，而是把模糊的概念精确化、定量化，从而可以用严格的运算方式和严密的逻辑体系来进行处理。

隶属度函数用精确的数学方法描述了概念的模糊性。

隶属度和概率的区别

尽管隶属度和概率都是用一个0～1之间的实数来表达，但是二者有本质区别。

隶属度表达的是某个命题具有某个概念的程度，这种程度是确定的，不包含任何的随机性，例如“今天天气热的程度是0.8”，表达的是一个确切的气温值，而这个温度值在0.8的程度上可以算作“热”。

概率表达的是某个命题具有某个概念的可能性，命题对这个概念的取值仍旧是二值的，“属于”或者“不属于”，只是是否“属于”具有随机性，例如“今天天气热的概率是0.8”，表达的是“热”或者“不热”这两个明确的概念，而“热”的情形发生的概率为0.8。

扎德L.A.Zadeh（1921～）

　　美国控制论专家，美国工程科学院院士。

现任伯克利加利福尼亚大学电机工程与计算机科学系教授。

因发展模糊集理论的先驱性工作而获电气与电子工程师学会（IEEE）的教育勋章。

1965年，扎德在《信息与控制》杂志第8期上发表《模糊集》的论文,开创了以精确数学方法研究模糊概念的模糊数学领域。

（3）模糊子集：

设集合A是集合U的一个子集，如对于任意U中的元素x，用隶属度函数μA（x）来表示x对A的隶属程度，则称A是U的一个模糊子集，记为：

A={μA（xi）,xi}

模糊子集也可以看作是论域U到区间[0,1]上的一个映射，映射规则为μA（x）。

当U为离散集时，模糊子集可以用下式表示：

x1,x2,…,xn称为模糊子集A的支持点。

当U为连续域时，模糊子集可以表示为：

（4）模糊集合的基本运算：

交集：

并集：

补集：

3、模糊集合的α水平截集

模糊子集本身没有确定边界，其水平截集有确定边界，并且不再是模糊集合，而是一个确定集合。

例：

年龄的取值集合为

U={50岁,45岁,40岁,35岁,30岁,25岁}

模糊集“年青”可表示为：

A=0/50岁+0.1/45岁+0.3/40岁+0.5/35岁+0.9/30岁+1/25岁

A的不同的水平截集为：

α=0，A0={50岁，45岁,40岁,35岁,30岁,25岁}

α=0.1，A0.1={45岁,40岁,35岁,30岁,25岁}

α=0.2，A0.2={40岁,35岁,30岁,25岁}

α=0.3，A0.3={40岁,35岁,30岁,25岁}

α=0.5，A0.5={35岁,30岁,25岁}

α=0.7，A0.7={30岁,25岁}

α=0.9，A0.9={30岁,25岁}

α=1，A1={25岁}

4、模糊关系及模糊矩阵

（1）集合的笛卡儿乘积

设U＝{x},V={y}为两个集合，则它们的笛卡儿乘积集为：

U×V={（x,y）|x∈U,y∈V},

（x,y）是U,V元素间的有序对。

（x,y）是一种无约束有顺序的组合，

笛卡尔乘积的运算不满足交换律，

特殊的笛卡尔乘积：

A＝{x}，A×A＝{（xi,xj）|xi,xj∈A}

（2）关系及其表示

设U＝{x},V={y}为两个集合，R为笛卡尔乘积U×V的一个子集，则称其为U×V中的一个关系。

关系R代表了对笛卡尔乘积集合中元素的一种选择约束。

关系的表示：

集合表示法：

R＝{（x1,y2）,（x2,y1）,（x3,y3）}

描述表示法：

R＝{（x,y）|x>y}

图形表示法：

关系图

矩阵表示法：

对有限集合上的关系，可以用矩阵表示：

例：

U＝{张三，李四，王五}，V＝{数学，英语，政治}

则关系R（选课）可表示为：

（3）模糊关系

如关系R是U×V的一个模糊子集，则称R为U×V的一个模糊关系，其隶属度函数为μR（x,y）

隶属度函数μR（x,y）表示x,y具有关系R的程度

该矩阵称为模糊矩阵

例1：

x为身高，y为体重；

x=（1.4,1.5,1.6,1.7,1.8）（单位m）

y=（40,50,60,70,80）（单位kg）

模糊关系“合乎标准”表示为：

1.4

0.8

0.2

1.5

0.8

0.2

1.6

0.2

0.8

0.2

1.7

0.2

0.8

1.8

0.2

0.8

也可记为：

例2：

样本集X中各样本之间的相似关系可表示为：

模糊矩阵的乘积（合成运算）：

；

二、模糊模式识别方法

1、最大隶属度识别法

（1）形式一：

设A1,A2,….,An是U中的n个模糊子集，且对每一Ai均有隶属度函数μi（x），x0为U中的任一元素，若有隶属度函数

μi（xo）=max[μ1（xo）,μ2（xo）,…..μn（xo）]

则xo∈Ai

若有了隶属度函数μ（x），我们把隶属度函数作为判别函数使用即可。

此法的关键是求隶属度函数

U中的每一个元素，代表了样本的一种取值情况，而Ai代表了不同的类别

例：

体型判断这一分类问题中，设样本仅有一维特征，为体型指标，分别有6种取值，取值域为U＝{5,10,15,20,25,30}，

三种体型类别用模糊子集可以定义为：

“偏胖”＝0/5+0.2/10+0.4/15+0.6/20+0.8/25+1/30

“标准”＝0.4/5+0.6/10+0.8/15+1/20+0.6/25+0.4/30

“偏瘦”＝1/5+0.8/10+0.6/15+0.4/20+0.2/25+0/30

如果某人的体型指标为15,则根据最大隶属度原则，可分到“标准”这一类。

（2）形式二：

设A是U中的1个模糊子集，x1～xn为U中的n个元素，若A的隶属度函数中，

μ（xk）=max[μ（x1）,μ（x2）,…..μ（xn）]

则A属于xk对应的类别

U中的每一个元素对应了一个类别

A代表一个样本，其隶属度函数代表了这个样本属于不同类别的程度

此法不仅能得到样本的分类结果，还可以得到样本与各个类间的相似程度排序

例：

设U为5种空中飞行目标的集合，U＝{直升飞机，大型飞机，战斗机，飞鸟，气球}，根据对一个飞行物体的运动特征检测，得到其模糊子集表达为：

A＝0.7/直升飞机+0.3/大型飞机+0.1/战斗机+0.4/飞鸟+0.8/气球

根据最大隶属度原则，可判断该飞行物体为“气球”。

2、择近原则识别法

（1）贴近度：

贴近度是两个模糊子集间互相靠近的程度，理想的贴近度应当具有以下性质：

贴近度定义很多，设A，B为U上的两个模糊子集，可以将它们之间的贴近度定义为：

（2）择近原则识别法：

设U上有n个模糊子集A1,A2,….,An及另一模糊子集B。

若贴近度

样本和类都用模糊子集来表示

取值范围U中的每个元素代表了一个特征维度

例：

某气象台对于当日气象条件的晨练指数预报分为三级，是用模糊集的方式，依据气温、风力、污染程度三个指标来决定的，具体隶属度关系见下表：

晨练指数级别

对“标准气温”的

隶属度

对“标准风力”的

隶属度

对“有污染”的

隶属度

适宜晨练

0.7

0.9

0.2

可以晨练

0.5

0.6

不适宜晨练

0.4

0.5

0.8

某天的气象条件用模糊集合来表达为：

B=0.8/标准气温+0.7/标准风力+0.5/有污染

请问：

该天的晨练指数应该预报为哪一级？

解：

用a来代表“标准气温”，b代表“标准风力”，c代表“有污染”

则该天的气象条件可表示为：

B=0.8/a+0.7/b+0.5/c

用A1表示“适宜晨练”，A2表示“可以晨练”，A3表示“不适宜晨练”

则各晨练指数级别可表示为：

A1＝0.7/a+0.9/b+0.2/c

A2＝0.5/a+0.6/b+0.6/c

A3＝0.4/a+0.5/b+0.8/c

分别求B和A1、A2、A3的贴近度

∵B和A2的贴近度最大，根据择近识别原则，B∈A2

∴该天的晨练指数应该预报为“可以晨练”。

3、基于模糊等价关系的聚类方法

（1）等价关系

设R是U＝{x}上一个关系，若满足：

（a）自反性：

（x,x）∈R

（b）对称性：

若（xi，xj）∈R，则有（xj，xi）∈R

（c）传递性：

若（xi，xj）∈R和（xj，xk）∈R，则有（xi，xk）∈R

则称R是U上一个等价关系。

等价关系定义了“等价”的概念；

当U上有一个等价关系R时，并不是U中所有元素都有等价关系，而是U中的元素可以按等价关系分成若干类。

（2）模糊等价关系

设R是U＝{x}上一个模糊关系，若满足：

（a）自反性：

μR（x,x）＝1

（b）对称性：

μR（xi，xj）＝μR（xj，xi）

（c）传递性：

对于任意xj∈U，有μR（xi，xk）≥∨（μR（xi，xj）∧μR（xj，xk））

则称R是U上一个模糊等价关系。

模糊等价关系具有传递闭包性：

R×R＝R，

不具有传递性的模糊关系称为模糊相似关系，可通过求R2，R4，R8……来获得一个逼近模糊等价关系的模糊关系。

（3）等价关系定理：

若R是U上的一个模糊等价关系。

则对任意阈值α（0≤α≤1）则水平截集Rα也是U上的一个等价关系。

（4）基于模糊等价关系的聚类

利用等价关系定理，已知样本集X上的模糊等价关系R，则可通过R的不同α水平截集得到多种等价类划分，也就实现了样本集在不同隶属度要求下的聚类。

例：

设X＝{x1、x2、x3、x4、x5}，有一个模糊等价关系R为：

取α＝0.4，得到水平截集为：

，此时所有样本等价，属于一类；

取α＝0.5，得到水平截集为：

，此时聚成两类，{x1,x3,x4,x5}和{x2}

取α＝0.6，得到水平截集为：

，此时聚成三类，{x1,x3}、{x4,x5}和{x2}

取α＝0.8，得到水平截集为：

，此时聚成四类，{x1,x3}、{x4}、{x5}和{x2}

取α＝0.4，得到水平截集为：

，此时聚成五类，每个样本自成一类

4、模糊k-均值聚类

在k-均值聚类算法中，每一次迭代的聚类结果可以用k行n列的矩阵U来表示：

其中n表示整个样本集中的样本个数，k表示类别数，uij的值表示第j个样本是否属于第i类，属于则uij=1，否则uij=0。

k-均值聚类算法的准则函数是误差平方和，即

模糊k-均值聚类（FCM，FussyC-Means）最早由Dunn提出，后由Bezkek于1981年进行了扩展和总结，它推广了精确k-均值聚类（硬聚类，HCM）算法，引入模糊集作为分类结果，得到了非常广泛的应用。

如果采用模糊集合的概念，在每次迭代中某个样本不是确定地属于某一个类，而是在不同程度上属于不同的类。

此时每个类别均是一个模糊子集，而分类矩阵U可以表示为：

其中：

uij∈[0,1]，是第j个样本对第i类的隶属度；

，表示每个样本属于各类的隶属度之和为1；

，表示每个类别都不为空集。

模糊k-均值聚类算法采用类似的误差平方和准则函数，但加入了模糊度的控制权重m∈[1,∞）：

算法的迭代过程，就是使准则函数Jm能逐步逼近其极值。

Jm是一个有约束的准则函数，其约束条件为

和

。

运用拉格朗日乘数法，可化为无约束的准则函数：

上式取极值的必要条件是：

可解得：

对于新的聚类中心，也应当使准则函数取得极值，即：

可解得：

模糊k-均值聚类的算法流程为：

（1）设定类别数k、模糊度控制权重m和误差限值ε，随机产生初始分类矩阵U（0），迭代次数t=0；计算各类的初始聚类中心mi（0）：

（2）按照以下规则计算新的分类矩阵U（t+1），获得新的模糊聚类结果：

（3）计算新的聚类中心mi（t+1）：

（4）计算分类误差

，若E<ε，则结束迭代；否则t=t+1，返回步骤

（2）进行下一次聚类迭代。

模糊k-均值聚类最终得到的是一个模糊分类矩阵，如需要得到确定的聚类结果，就要进行去模糊化。

可以采用最大隶属度原则讲一个样本分配到隶属度最大的类别中去。

在模糊k-均值聚类算法中，模糊度控制权重m表达了对于每次聚类结果的模糊程度的要求，

的物理意义是隶属度的语义增强（“非常”的概念）。

m的取值对聚类结果的影响有许多研究，目前尚无定论。

通常取1.5~2.5之间比较有效，常取m=2；当m=1时FCM也就退化成了HCM。

展开阅读全文

第九讲 模糊模式识别.docx

第九讲模糊模式识别.docx