ImageVerifierCode 换一换
格式:DOCX , 页数:6 ,大小:21.15KB ,
资源ID:2864875      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/2864875.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(三枝决策粗糙集模型属性约简研究.docx)为本站会员(b****5)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

三枝决策粗糙集模型属性约简研究.docx

1、三枝决策粗糙集模型属性约简研究三枝决策粗糙集模型属性约简研究摘 要:三枝决策粗糙集模型作为Pawlak粗糙集模型的推广,它是将贝叶斯决策过程引入到概率粗集模型中得到的,其区域分类以正、负和边界为基础,可以更精确地体现粗糙集的近似基本原理。描述了三枝决策粗糙集模型的约简,并与Pawlak粗糙集模型、概率粗糙集模型进行比较;最后讨论了三枝决策概率粗糙集在实际问题中的应用。关键词:三枝决策;概率粗糙集;Pawlak粗糙集;属性约简 0 引言 粗糙集理论于1982年由波兰科学家Pawlak提出,它是一种研究不确定、不完整知识和数据的表达、学习、归纳的理论方法。粗糙集理论引入上近似、下近似等概念开刻画知

2、识的不确定性和模糊性;引入约减和求核进行知识的化简等计算。其中,上下近似是粗糙集中的基础算子。经典的Pawlak粗糙集利用等价关系将论域分为正域、边界域和负域三个部分。但是,它要求完全正确的决策才能进入正域,这种严格的划分导致正域的对象非常少。针对上述Pawlak粗糙集模型没有考虑到容错的问题,于是Wong和Ziarko将概率近似空间引入到粗糙集的研究中,并提出0.5概率粗集模型。Ziarko提出了可变精度粗糙集模型。在1990年,Yao,Wong和Lingras提出了更一般性的概率粗糙集模型,即决策粗糙集模型。随后,Yao进一步提出了三枝决策粗糙集,它更能代表概率粗糙集的思想,精确地反映了粗

3、糙集的近似原理,并可以用来解释实际生活中的很多决策现象。 属性约简是在保持系统分类能力不变的情况下,为了提高数据处理的效率,删除其中不重要的和无关属性,也就是可以用较少的知识获得与原知识库相同的决策能力。属性约简是粗糙集理论的重要研究内容之一,也是三枝决策粗糙集模型的主要研究内容。Yao和Zhao研究了决策粗糙集的属性约简,指出决策粗糙集模型的约简理论不同于Pawlak粗糙集模型的约简理论,它的约简考虑到不同的分类性能。 基于此,本文主要在分析了决策粗糙集模型下的三枝决策思想的基础上,介绍了三枝决策问题的粗糙集属性约简模型的属性约简方法,并与Pawlak粗糙集属性约简、概率粗糙集模型的约简进行

4、了比较,最后简单说明了三枝决策在实际生活中的应用。 1 三枝决策粗糙集 1.1 决策粗糙集模型 由于在Pawlak粗集中,只有完全包含于某个概念的等价类才属于集合X,并没有考虑到规则的容错性,这就需要引进条件概率、概率粗集等相关概念。Yao在文献2,7中论述决策粗糙集可转换为各种概率粗糙集。下面介绍相关决策粗集的基本概念和定义。 定义1 令 Pr (Xx) 表示任何一个实体属于x的条件属性X的条件概率。Pr(X| x )=| x X| x ,|•|表示集合中元素的基数。 定义2 用一对概率阈值来定义概率正、负和边界域。设 01,则(,) 概率正、负和边界域为: POS (,) (X

5、)=xU|Pr(X|x) BND (,) (X)=xU|Pr(X|x) NEG- (,) (X)=xX|Pr(X|x)(2) 当 =0 和 =1 时,上述模型将转化为Pawlak粗集模型。 =0.5 时,上述模型转换为0.5概率粗集模型。设 S=(U,A,V,F) 是一个信息系统, =w 1,w 2w n 为n个状态集, A=a 1,a 2a m 为m个行动集。 Pr(W i|x) 表示x在状态 w i 下地条件概率。 (a j|w i) 表示在状态 w i 下做出决策 a j 的损失。如果对象x采取了行动 a j ,则其期望损失为: R(a j|x)=ni=1(a j|w i) Pr (w

6、i|x) (3) 贝叶斯决策论很广泛的应用于多个领域。决策粗糙集可以认为是贝叶斯决策理论的一个简单应用,其描述如下:一个子集 C U ,可以构造一个含两个状态的集合 =C,C c ,对应于粗糙集的三个域,我们可以构造一个决策动作集 A=a P,a B,a N ,其中, a P , a B 和 a N 分别代表一个对象分类的动作,即,选择 xPOS(C),xBND(C) 或 xNEG(C) 。不同的决策会引导不同的分类错误,也将产生不同的后果。这可以由一个32的矩阵表示,如表1所示: 其中, PP , BP 和-NP分别表示当一个对象属于集合 C 时,采用动作 a P , a B 和 a N 的

7、损失。 PN , BN 和-NN分别表示当一个对象不属于集合 C 时,采用这些动作的损失。因此,采取 a P , a B 和 a N 3种行动下的期望损失可分别表示为: Ra P|x A= PP PrC|x A+ PN PrC c|x A Ra B|x A= BP PrC|x A+ BN PrC c|x A Ra N|x A= NP PrC|x A+ NN PrC c|x A (4) 根据贝叶斯决策准则,需要选择期望损失最小的行动集作为最佳行动方案,于是可得到如下3条决策规则: (P): If Ra P|x ARa N|x A and Ra P|x ARa B|x A ,decide xPOS

8、(C) ; (B): If Ra B|x ARa P|x A and Ra B|x ARa N|x A ,decide xBND(C) ; (N): If Ra N|x ARa P|x A and Ra N|x ARa B|x A ,decide xNEG(C) (5) 由 Pr (C|x)+ Pr (C c|x)=1 ,上述规则只与概率 Pr (C|x) 和相关的损失函数 有关。对于决策代价函数值的大小,有如下关系 PP BP NP , NN BN PN 。根据上述条件,决策规则可重新定义为: (P): If Pr (C|x) and Pr (C|x) ,decide xPOS(C) ; (

9、B): If Pr (C|x) and Pr (C|x) ,decide xBND(C) ; (N): If Pr (C|x) and Pr (C|x) ,decide xNEG(C) ; 其中, , 和 记为: = PN BN ( PN BN )+( BP PP ) = BN NN ( BN NN )+( NP BP ) = PN NN ( PN NN )+( NP PP ) (6) 在损失函数中如果增加一个条件: (PB)N (NB)P (BN)N (BP)P ,可以得到 。由 (PB)N (NB)P (BN)N (BP)P (PB)N (BN)N (BP)P (NB)P (NB)P (B

10、N)N (BP)P (PB)N ,即有 0 。决策规则仅用 和 来定义: (P): If Pr (C|x) ,decide xPOS(C) ; (B): If Pr (C|x) ,decide xBND(C) ; (N): If Pr (C|x) ,decide xNEG(C) ; (7) 决策粗糙集模型不仅基于概率模型,而且阈值都是可计算得到的。正因如此,决策粗糙集更能代表一般的概率粗糙集思想。 1.2 三枝决策的决策粗糙集理论 在决策粗糙集理论中,论域 和 被划分为3个区域,这3个区域对应了3个规则,我们把这3个规则称为 (,) 三枝决策规则。如图1所示,具体的说: X发生的概率大于阈值

11、,即从正域里获取的规则(正规则),用来接受某事物(accep tan ce); X发生概率小于阈值 ,即从负域里获取规则(负规则),用来表示拒绝某事物(rejection); X发生的概率介于阈值 和 之间,即落在边界域上的规则(边界规则),表示需要进一步观察,即延迟决策(deferment)。2 决策粗糙集理论的约简 属性约简是粗糙集理论的核心。约简是用来解决冗余或者可忽视的知识的问题,直观地说,属性约简就是从条件属性中发现部分必要的条件属性,使这部分条件属性和所有条件属性相对于决策属性有相同的分类能力。 2.1 Pawlak约简 Pawlak约简 R C 和决策属性D是密切相关的,它被定义

12、为正域不变的独立条件属性子集。 为条件属性集, D=D 1,D 2,.,D m 为决策属性划分, C 为条件属性划分。假设一个信息表 S=(U,At=CD,V a|aA t,I a|aA t) ,一个属性集 R C 是C关于D的一个pawlak约简,则它满足如下2个条件: (s)正域不变性: POS R ( D)=POS C ( D) (n)独立性: aR,POS Ra ( D)POS C ( D) (8) 在Pawlak粗糙集模型的约简中,我们看到了2个极端置信度。根据Pawlk粗糙集中正域的定义,正规则的置信度(confidence)为1。对于边界规则,它的置信度大于等于0,它是最小的置信

13、度值。 R C 是C关于D的一个pawlak约简,则 POS R ( D)BND R ( D)= ; POS R ( D)BND R ( D)=U 。 POS R ( D)=POS C ( D) 等价于 BND R ( D)=BND C ( D) 。因此,在Pawlak约简中存在隐含的相同的边界域。 2.2 概率粗糙集模型约简 通过对Pawlak粗糙集模型约简的学习和分析,发现该属性约简方法不适合概率粗糙集模型,我们定义概率粗糙集模型的属性约简,假设决定一个信息表, S=(U,At=CD,V a|aA t,I a|aA t) 一个属性集 R C 是C关于D的一个约简,则它满足如下2个条件: (

14、s)正域不变性: POS- R(,) (-D)=POS- C(,) (-D) (n)独立性: aR,POS R-a(,) ( D)POS C- (,) ( D) (9) 概率粗糙集模型域的定义等价类 x 和决策类的交集不为空,即 xD max (x) 。负规则x-PD-max(x)由阈值 决定,边界规则x-BD-max(x)由阈值 决定。阈值 可以不是最大值1, 可以不是最小值0。在概率粗糙集模型中, R C 是C关于D的一个约简,则 POS R ( D)BND R ( D)U ,因此,在约简时,我们可以需要考虑正区域的概率和边界域的概率。 2.3 决策粗糙集约简 在Pawlak粗糙集模型中,由于正域具有相对于条件属性的单调性,约简只需保证条件属性相对决策属性的依赖度不变。然而,在决策粗糙集模型中,正域不再具有相对于条件属性的单调性,仅保持依赖度 不变不能作为决策粗

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1