三枝决策粗糙集模型属性约简研究.docx

上传人:b****5 文档编号:2864875 上传时间:2022-11-16 格式:DOCX 页数:6 大小:21.15KB
下载 相关 举报
三枝决策粗糙集模型属性约简研究.docx_第1页
第1页 / 共6页
三枝决策粗糙集模型属性约简研究.docx_第2页
第2页 / 共6页
三枝决策粗糙集模型属性约简研究.docx_第3页
第3页 / 共6页
三枝决策粗糙集模型属性约简研究.docx_第4页
第4页 / 共6页
三枝决策粗糙集模型属性约简研究.docx_第5页
第5页 / 共6页
点击查看更多>>
下载资源
资源描述

三枝决策粗糙集模型属性约简研究.docx

《三枝决策粗糙集模型属性约简研究.docx》由会员分享,可在线阅读,更多相关《三枝决策粗糙集模型属性约简研究.docx(6页珍藏版)》请在冰豆网上搜索。

三枝决策粗糙集模型属性约简研究.docx

三枝决策粗糙集模型属性约简研究

三枝决策粗糙集模型属性约简研究

摘要:

三枝决策粗糙集模型作为Pawlak粗糙集模型的推广,它是将贝叶斯决策过程引入到概率粗集模型中得到的,其区域分类以正、负和边界为基础,可以更精确地体现粗糙集的近似基本原理。

描述了三枝决策粗糙集模型的约简,并与Pawlak粗糙集模型、概率粗糙集模型进行比较;最后讨论了三枝决策概率粗糙集在实际问题中的应用。

  关键词:

三枝决策;概率粗糙集;Pawlak粗糙集;属性约简

  0引言

  粗糙集理论于1982年由波兰科学家Pawlak提出,它是一种研究不确定、不完整知识和数据的表达、学习、归纳的理论方法。

粗糙集理论引入上近似、下近似等概念开刻画知识的不确定性和模糊性;引入约减和求核进行知识的化简等计算。

其中,上下近似是粗糙集中的基础算子。

经典的Pawlak粗糙集利用等价关系将论域分为正域、边界域和负域三个部分。

但是,它要求完全正确的决策才能进入正域,这种严格的划分导致正域的对象非常少。

针对上述Pawlak粗糙集模型没有考虑到容错的问题,于是Wong和Ziarko将概率近似空间引入到粗糙集的研究中,并提出0.5概率粗集模型。

Ziarko提出了可变精度粗糙集模型。

在1990年,Yao,Wong和Lingras提出了更一般性的概率粗糙集模型,即决策粗糙集模型。

随后,Yao进一步提出了三枝决策粗糙集,它更能代表概率粗糙集的思想,精确地反映了粗糙集的近似原理,并可以用来解释实际生活中的很多决策现象。

  属性约简是在保持系统分类能力不变的情况下,为了提高数据处理的效率,删除其中不重要的和无关属性,也就是可以用较少的知识获得与原知识库相同的决策能力。

属性约简是粗糙集理论的重要研究内容之一,也是三枝决策粗糙集模型的主要研究内容。

Yao和Zhao研究了决策粗糙集的属性约简,指出决策粗糙集模型的约简理论不同于Pawlak粗糙集模型的约简理论,它的约简考虑到不同的分类性能。

  基于此,本文主要在分析了决策粗糙集模型下的三枝决策思想的基础上,介绍了三枝决策问题的粗糙集属性约简模型的属性约简方法,并与Pawlak粗糙集属性约简、概率粗糙集模型的约简进行了比较,最后简单说明了三枝决策在实际生活中的应用。

  1三枝决策粗糙集

  1.1决策粗糙集模型

  由于在Pawlak粗集中,只有完全包含于某个概念的等价类才属于集合X,并没有考虑到规则的容错性,这就需要引进条件概率、概率粗集等相关概念。

Yao在文献[2,7]中论述决策粗糙集可转换为各种概率粗糙集。

下面介绍相关决策粗集的基本概念和定义。

  定义1令Pr(X[x])表示任何一个实体属于[x]的条件属性X的条件概率。

Pr(X|[x])=|[x]∩X|[][x],|•|表示集合中元素的基数。

  定义2用一对概率阈值来定义概率正、负和边界域。

设0≤β<α≤1,则(β,α)概率正、负和边界域为:

  POS(α,β)(X)={x∈U|Pr(X|[x])≥α}

  BND(α,β)(X)={x∈U|β<Pr(X|[x])<α

  NEG-(α,β)(X)={x∈X|Pr(X|[x]≤β)

(2)

  当β=0和α=1时,上述模型将转化为Pawlak粗集模型。

β=α=0.5时,上述模型转换为0.5概率粗集模型。

设S=(U,A,V,F)是一个信息系统,Ω={w1,w2……wn}为n个状态集,A={a1,a2……am}为m个行动集。

Pr(Wi|[x])表示x在状态wi下地条件概率。

λ(aj|wi)表示在状态wi下做出决策aj的损失。

如果对象x采取了行动aj,则其期望损失为:

  R(aj|x)=∑ni=1(aj|wi)Pr(wi|x)(3)

  贝叶斯决策论很广泛的应用于多个领域。

决策粗糙集可以认为是贝叶斯决策理论的一个简单应用,其描述如下:

一个子集CU,可以构造一个含两个状态的集合Ω={C,Cc},对应于粗糙集的三个域,我们可以构造一个决策动作集A={aP,aB,aN},其中,aP,aB和aN分别代表一个对象分类的动作,即,选择x∈POS(C),x∈BND(C)或x∈NEG(C)。

不同的决策会引导不同的分类错误,也将产生不同的后果。

这可以由一个3×2的矩阵表示,如表1所示:

  

  其中,λPP,λBP和λ-{NP}分别表示当一个对象属于集合C时,采用动作aP,aB和aN的损失。

λPN,λBN和λ-{NN}分别表示当一个对象不属于集合C时,采用这些动作的损失。

因此,采取aP,aB和aN3种行动下的期望损失可分别表示为:

  RaP|xA=λPPPrC|xA+λPNPrCc|xA

  RaB|xA=λBPPrC|xA+λBNPrCc|xA

  RaN|xA=λNPPrC|xA+λNNPrCc|xA(4)

  根据贝叶斯决策准则,需要选择期望损失最小的行动集作为最佳行动方案,于是可得到如下3条决策规则:

  (P):

IfRaP|xA≤RaN|xAandRaP|xA≤RaB|xA,decidex∈POS(C);

  (B):

IfRaB|xA≤RaP|xAandRaB|xA≤RaN|xA,decidex∈BND(C);

  (N):

IfRaN|xA≤RaP|xAandRaN|xA≤RaB|xA,decidex∈NEG(C)(5)

  由Pr(C|[x])+Pr(Cc|[x])=1,上述规则只与概率Pr(C|[x])和相关的损失函数λ有关。

对于决策代价函数值的大小,有如下关系λPP≤λBP≤λNP,λNN≤λBN≤λPN。

根据上述条件,决策规则可重新定义为:

  (P):

IfPr(C|[x])≥αandPr(C|[x])≥γ,decidex∈POS(C);

  (B):

IfPr(C|[x])≤αandPr(C|[x])≥β,decidex∈BND(C);

(N):

IfPr(C|[x])≤βandPr(C|[x])≤γ,decidex∈NEG(C);

  其中,α,β和γ记为:

  α=λPN-λBN(λPN-λBN)+(λBP-λPP)

  β=λBN-λNN(λBN-λNN)+(λNP-λBP)

  γ=λPN-λNN(λPN-λNN)+(λNP-λPP)(6)

  在损失函数中如果增加一个条件:

λ(P-B)Nλ(N-B)P>λ(B-N)Nλ(B-P)P,可以得到α>β。

由λ(P-B)Nλ(N-B)P>λ(B-N)Nλ(B-P)Pλ(P-B)Nλ(B-N)N>λ(B-P)Pλ(N-B)Pλ(N-B)Pλ(B-N)N>λ(B-P)Pλ(P-B)N,即有α>γ>β≥0。

决策规则仅用α和β来定义:

  (P):

IfPr(C|[x])≥α,decidex∈POS(C);

  (B):

Ifβ

  (N):

IfPr(C|[x])≤β,decidex∈NEG(C);(7)

  决策粗糙集模型不仅基于概率模型,而且阈值都是可计算得到的。

正因如此,决策粗糙集更能代表一般的概率粗糙集思想。

  1.2三枝决策的决策粗糙集理论

  在决策粗糙集理论中,论域α和β被划分为3个区域,这3个区域对应了3个规则,我们把这3个规则称为(α,β)三枝决策规则。

如图1所示,具体的说:

  

  X发生的概率大于阈值α,即从正域里获取的规则(正规则),用来接受某事物(acceptance);

  X发生概率小于阈值β,即从负域里获取规则(负规则),用来表示拒绝某事物(rejection);

  X发生的概率介于阈值α和β之间,即落在边界域上的规则(边界规则),表示需要进一步观察,即延迟决策(deferment)。

  

  2决策粗糙集理论的约简

  属性约简是粗糙集理论的核心。

约简是用来解决冗余或者可忽视的知识的问题,直观地说,属性约简就是从条件属性中发现部分必要的条件属性,使这部分条件属性和所有条件属性相对于决策属性有相同的分类能力。

  2.1Pawlak约简

  Pawlak约简RC和决策属性D是密切相关的,它被定义为正域不变的独立条件属性子集。

π为条件属性集,πD={D1,D2,...,Dm}为决策属性划分,πC为条件属性划分。

假设一个信息表S=(U,At=C∪{D},{Va|a∈At},{Ia|a∈At}),一个属性集RC是C关于D的一个pawlak约简,则它满足如下2个条件:

  (s)正域不变性:

POSπR(πD)=POSπC(πD)

  (n)独立性:

a∈R,POSπR-{a}(πD)≠POSπC(πD)(8)

  在Pawlak粗糙集模型的约简中,我们看到了2个极端置信度。

根据Pawlk粗糙集中正域的定义,正规则的置信度(confidence)为1。

对于边界规则,它的置信度大于等于0,它是最小的置信度值。

RC是C关于D的一个pawlak约简,则POSπR(πD)∩BNDπR(πD)=;POSπR(πD)∪BNDπR(πD)=U。

POSπR(πD)=POSπC(πD)等价于BNDπR(πD)=BNDπC(πD)。

因此,在Pawlak约简中存在隐含的相同的边界域。

  2.2概率粗糙集模型约简

  通过对Pawlak粗糙集模型约简的学习和分析,发现该属性约简方法不适合概率粗糙集模型,我们定义概率粗糙集模型的属性约简,假设决定一个信息表,S=(U,At=C∪{D},{Va|a∈At},{Ia|a∈At})一个属性集RC是C关于D的一个约简,则它满足如下2个条件:

  (s)正域不变性:

POS-{π-R(α,β)}(π-D)=POS-{π-C(α,β)}(π-D)

  (n)独立性:

a∈R,POSπR-{a}(α,β)(πD)≠POSπC-(α,β)(πD)(9)

  概率粗糙集模型域的定义等价类[x]和决策类的交集不为空,即[x]∩Dmax([x])≠。

负规则[x]→-PD-{max}([x])由阈值α决定,边界规则[x]→-BD-{max}([x])由阈值β决定。

阈值α可以不是最大值1,β可以不是最小值0。

在概率粗糙集模型中,RC是C关于D的一个约简,则POSπR(πD)∪BNDπR(πD)≠U,因此,在约简时,我们可以需要考虑正区域的概率和边界域的概率。

  2.3决策粗糙集约简

  在Pawlak粗糙集模型中,由于正域具有相对于条件属性的单调性,约简只需保证条件属性相对决策属性的依赖度不变。

然而,在决策粗糙集模型中,正域不再具有相对于条件属性的单调性,仅保持依赖度γ不变不能作为决策粗

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 表格模板 > 调查报告

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1