模糊数学.docx
《模糊数学.docx》由会员分享,可在线阅读,更多相关《模糊数学.docx(21页珍藏版)》请在冰豆网上搜索。
![模糊数学.docx](https://file1.bdocx.com/fileroot1/2022-11/20/20949671-aee1-4172-9776-03a7d2963e4f/20949671-aee1-4172-9776-03a7d2963e4f1.gif)
模糊数学
模糊数学方法
在自然科学或社会科学研究中,存在着许多定义不很严格或者说具有模糊性的概念。
这里所谓的模糊性,主要是指客观事物的差异在中间过渡中的不分明性,如某一生态条件对某种害虫、某种作物的存活或适应性可以评价为“有利、比较有利、不那么有利、不利”;灾害性霜冻气候对农业产量的影响程度为“较重、严重、很严重”,等等。
这些通常是本来就属于模糊的概念,为处理分析这些“模糊”概念的数据,便产生了模糊集合论。
根据集合论的要求,一个对象对应于一个集合,要么属于,要么不属于,二者必居其一,且仅居其一。
这样的集合论本身并无法处理具体的模糊概念。
为处理这些模糊概念而进行的种种努力,催生了模糊数学。
模糊数学的理论基础是模糊集。
模糊集的理论是1965年美国自动控制专家查德(L.A.Zadeh)教授首先提出来的,近10多年来发展很快。
模糊集合论的提出虽然较晚,但目前在各个领域的应用十分广泛。
实践证明,模糊数学在农业中主要用于病虫测报、种植区划、品种选育等方面,在图像识别、天气预报、地质地震、交通运输、医疗诊断、信息控制、人工智能等诸多领域的应用也已初见成效。
从该学科的发展趋势来看,它具有极其强大的生命力和渗透力。
在侧重于应用的模糊数学分析中,经常应用到聚类分析、模式识别和综合评判等方法。
在DPS系统中,我们将模糊数学的分析方法与一般常规统计方法区别开来,列专章介绍其分析原理及系统设计的有关功能模块程序的操作要领,供用户参考和使用。
第1节模糊聚类分析
1.模糊集的概念
对于一个普通的集合A,空间中任一元素x,要么xA,要么xA,二者必居其一。
这一特征可用一个函数表示为:
A(x)即为集合A的特征函数。
将特征函数推广到模糊集,在普通集合中只取0、1两值推广到模糊集中为[0,1]区间。
定义1设X为全域,若A为X上取值[0,1]的一个函数,则称A为模糊集。
如给5个同学的性格稳重程度打分,按百分制给分,再除以100,这样给定了一个从域X={x1,x2,x3,x4,x5}到[0,1]闭区间的映射。
x1:
85分,即A(x1)=0.85
x2:
75分,A(x2)=0.75
x3:
98分,A(x3)=0.98
x4:
30分,A(x4)=0.30
x5:
60分,A(x5)=0.60
这样确定出一个模糊子集A=(0.85,0.75,0.98,0.30,0.60)。
定义2若A为X上的任一模糊集,对任意01,记A={x|xX,A(x)},称A为A的截集。
A是普通集合而不是模糊集。
由于模糊集的边界是模糊的,如果要把模糊概念转化为数学语言,需要选取不同的置信水平(01)来确定其隶属关系。
截集就是将模糊集转化为普通集的方法。
模糊集A是一个具有游移边界的集合,它随值的变小而增大,即当1<2时,有A1∩A2。
定义3模糊集运算定义。
若A、B为X上两个模糊集,它们的和集、交集和A的余集都是模糊集,其隶属函数分别定义为:
(AB)(x)=max(A(x),B(x))
(AB)(x)=min(A(x),B(x))
AC(x)=1-A(x)
关于模糊集的和、交等运算,可以推广到任意多个模糊集合中去。
定义4若一个矩阵元素取值为[0,1]区间内,则称该矩阵为模糊矩阵。
同普通矩阵一样,有模糊单位阵,记为I;模糊零矩阵,记为0;元素皆为1的矩阵用J表示。
定义5若A和B是n×m和m×l的模糊矩阵,则它们的乘积C=AB为n×l阵,其元素为:
Cij=
(i=1,2,…,n;j=1,2,…,l)(20.1)
符号“∨”和“∧”含意的定义为:
a∨b=max(a,b),a∧b=min(a,b)。
模糊矩阵乘法性质包括:
1)(AB)C=A(BC);2)AI=IA=A;3)A0=0A=0;4)AJ=JA;5)若A、B为模糊矩阵且aijbij(一切i,j),则AB,又若AB,则ACBC,CACB。
2.模糊分类关系
模糊聚类分析是在模糊分类关系基础上进行聚类。
由集合的概念,可给出如下定义:
定义6n个样品的全体所组成的集合X作为全域,令XY={(X,Y)|xX,yY},则称XY为X的全域乘积空间。
定义7设R为XY上的一个集合,并且满足:
1)反身性:
(xi,yi)R,即集合中每个元素和它自己同属一类;
2)对称性:
若(x,y)R,则(y,x)R,即集合中(x,y)元素同属于类R时,则(y,x)也同属于R;
3)传递性:
(x,y)R,(y,z)R,则有(x,z)R。
上述三条性质称为等价关系,满足这三条性质的集合R为一分类关系。
聚类分析的基本思想是用相似性尺度来衡量事物之间的亲疏程度,并以此来实现分类,模糊聚类分析的实质就则是根据研究对象本身的属性未构造模糊矩阵,在此基础上根据一定的隶属度来确定其分类关系。
3.模糊聚类
利用模糊集理论进行聚类分析的具体步骤如下:
(1)若定义相似系数矩阵用的是定量观察资料,在定义相似系数矩阵之前,可先对原始数据进行变换处理,变换的方法同系统聚类分析,可参考第17章系统聚类分析一节。
(2)计算模糊相似矩阵。
设U是需要被分类对象的全体,建立U上的相似系数R,R(i,j)表示i与j之间的相似程度,当U为有限集时,R是一个矩阵,称为相似系数矩阵。
定义相似系数矩阵的工作,原则上可以按系统聚类分析中的相似系数确定方法,但也可以用主观评定或集体打分的办法。
DPS平台,对数据集
提供了以下8种建立相似矩阵的方法:
①相关系数法:
②最大最小法:
③算术平均最小法:
④几何平均最小法:
⑤绝对指数法:
⑥绝对值减数法:
⑦夹角余弦法:
⑧欧氏距离:
(3)聚类分析。
用上述方法建立起来的相似关系R,一般只满足反射性和对称性,不满足传递性,因而还不是模糊等价关系。
为此,需要将R改造成R*后得到聚类图,在适当的阈值上进行截取,便可得到所需要的分类。
将R改造成R*,可用求传递闭包的方法。
。
R自乘的思想是按最短距离法原则,寻求两个向量xi与xj的亲密程度。
假设R2=(rij),即rij=
(rik∧rkj),说明xi与xj是通过第三者K作为媒介而发生关系,rik∧rkj表示xi与xj的关系密切程度是以min(rik,rkj)为准则,因k是任意的,故从一切rik∧rkj中寻求一个使xi和xj关系最密切的通道。
Rm随m的增加,允许连接xi与xj的链的边就越多。
由于从xi到xj的一切链中,一定存在一个使最大边长达到极小的链,这个边长就是相当于
。
在实际处理过程中,R的收敛速度是比较快的。
为进一步加快收敛速度,通常采取如下处理方法:
R→R2→R4→R8→…→R2k
即先将R自乘改造为R2,再自乘得R4,如此继续下去,直到某一步出现R2k=Rk=R*。
此时R*满足了传递性,于是模糊相似矩阵(R)就被改造成了一个模糊等价关系矩阵(R*)。
(4)模糊聚类。
对满足传递性的模糊分类关系的R*进行聚类处理,给定不同置信水平的,求
阵,找出R*的显示,得到普通的分类关系。
当=1时,每个样品自成一类,随值的降低,由细到粗逐渐归并,最后得到动态聚类谱系图。
4.DPS平台操作示例
首先在编辑状态下输入编辑数据,格式是每一行为一个样本,每一列为一个变量,然后将待分析的数据定义成数据矩阵块,在菜单方式下选择“模糊数学模糊聚类”功能项,回车执行时,系统将提示用户选择数据转换方法:
0.不转换1.数据中心化2.对数转换3.数据规格化4.数据标准化
作出数据转换方式的选择后,系统又将提示选择建立模糊相似关系的计算方法,共有上面所述的8种方法可供选择。
分析输出的结果包括各个样本的联结序号、联结水平、聚类谱系图索引及在屏幕上显示聚类谱系图(拷屏可得到谱系图硬拷贝,或按S将图形文件以“.BMP”格式存放在盘上,然后可在Windows有关应用软件中调出)。
第2节模糊模式识别
1.方法简介
“模式”一词来源于英文Pattern,原意是典范、式样、样品,在不同场合有其不同的含义。
在此我们讲的模式是指具有一定结构的信息集合。
模式识别就是识别给定的事物以及与它相同或类似的事物,也可以理解为模式的分类,即把样品分成若干类,判断给定事物属于哪一类,这与我们前面介绍的判别分析很相似。
模式识别的方法大致可以分为两种,即根据最大隶属原则进行识别的直接法和根据择近原则进行归类的间接法,分别简介如下:
(1)若已知n个类型在被识别的全体对象U上的隶属函数,则可按隶属原则进行归类。
此处介绍的是针对正态型模糊集的情形。
对于正态型模糊变量x,其隶属度为
其中a为均值,b2=22,2为相应的方差。
按泰勒级数展开,取近似值得
若有n种类型m个指标的情形,则第i种类型在第j种指标上的隶属函数是
其中
和
分别是第i类元素第j种指标的最小值和最大值,
而
是第i类元素第j种指标的方差。
(2)若有n种类型(A1,A2,…,AN),每类都有m个指标,且均为正态型模糊变量,相应的参数分别为
(i=1,2,…,n;j=1,2,…,m)。
其中,
而
是xij的方差。
待判别对象B的m个指标分别具有参数aj,bj(j=1,2,…,m),且为正态型模糊变量,则B与各个类型的贴近度为
记Si=
,又有Si0=
,按贴近原则可认为B与Ai0最贴近。
序
号
年
份
幼虫发生量
发生期
增殖系数
类别
第二代
第三代
第二代
第三代
二至三代
三至四代
1
1962
344
3333
29
9
9.69
1.91
1
2
1963
121
1497
27
19
12.37
1.34
1
3
1964
187
1813
32
18
9.70
1.06
1
:
:
:
:
:
:
:
:
:
27
1988
162
2817
34
21
2.64
0.00
3
28
1989
760
877
39
33
1.15
0.00
0
29
1990
458
199
35
27
0.43
0.00
0
图303模糊识别分析的数据编辑定义图
根据如上介绍,DPS系统中设计了两个功能模块:
一是根据在集合上的隶属函数,按隶属原则识别对象,判定样本的类别归属;二是根据模糊集两两之间的贴近度,按择近原则,确定出最接近的两个模糊集。
2.DPS平台的操作示例
系统规定数据输入的格式是每一行为一个样本,每一列为一个变量。
最右边的一列为样本的已知类别(如1,2,…)。
(注意每一类中至少要有三个样本)。
对于待判别的样本,其分类类别用0表示。
所有待分析数据(连同类别一起)需定义成数据块,然后进入菜单操作,选择“模糊数学模糊识别”功能项,回车执行后即可输出分析结果。
输出结果包括各类参数(变量名、最小值、最大值、标准差和参数B)和各待判样本的归类结果(样本序号、对各类贴近度的最大值、最贴近的类号)。
注意事项:
系统最多可处理20个因子,100个样本。
例如,在“有序样本最优分割”一节中,我们将历年三化螟发生动态根据最优分割结果分成3类,即将三化螟种群消