三枝决策粗糙集模型属性约简研究.docx-资源下载

三枝决策粗糙集模型属性约简研究.docx

1、三枝决策粗糙集模型属性约简研究三枝决策粗糙集模型属性约简研究摘要：三枝决策粗糙集模型作为Pawlak粗糙集模型的推广，它是将贝叶斯决策过程引入到概率粗集模型中得到的，其区域分类以正、负和边界为基础，可以更精确地体现粗糙集的近似基本原理。描述了三枝决策粗糙集模型的约简，并与Pawlak粗糙集模型、概率粗糙集模型进行比较；最后讨论了三枝决策概率粗糙集在实际问题中的应用。关键词：三枝决策；概率粗糙集；Pawlak粗糙集；属性约简 0 引言粗糙集理论于1982年由波兰科学家Pawlak提出，它是一种研究不确定、不完整知识和数据的表达、学习、归纳的理论方法。粗糙集理论引入上近似、下近似等概念开刻画知

2、识的不确定性和模糊性；引入约减和求核进行知识的化简等计算。其中，上下近似是粗糙集中的基础算子。经典的Pawlak粗糙集利用等价关系将论域分为正域、边界域和负域三个部分。但是，它要求完全正确的决策才能进入正域，这种严格的划分导致正域的对象非常少。针对上述Pawlak粗糙集模型没有考虑到容错的问题，于是Wong和Ziarko将概率近似空间引入到粗糙集的研究中，并提出0.5概率粗集模型。Ziarko提出了可变精度粗糙集模型。在1990年，Yao，Wong和Lingras提出了更一般性的概率粗糙集模型，即决策粗糙集模型。随后，Yao进一步提出了三枝决策粗糙集，它更能代表概率粗糙集的思想，精确地反映了粗

3、糙集的近似原理，并可以用来解释实际生活中的很多决策现象。属性约简是在保持系统分类能力不变的情况下，为了提高数据处理的效率，删除其中不重要的和无关属性，也就是可以用较少的知识获得与原知识库相同的决策能力。属性约简是粗糙集理论的重要研究内容之一，也是三枝决策粗糙集模型的主要研究内容。Yao和Zhao研究了决策粗糙集的属性约简，指出决策粗糙集模型的约简理论不同于Pawlak粗糙集模型的约简理论，它的约简考虑到不同的分类性能。基于此，本文主要在分析了决策粗糙集模型下的三枝决策思想的基础上，介绍了三枝决策问题的粗糙集属性约简模型的属性约简方法，并与Pawlak粗糙集属性约简、概率粗糙集模型的约简进行

4、了比较，最后简单说明了三枝决策在实际生活中的应用。 1 三枝决策粗糙集 1.1 决策粗糙集模型由于在Pawlak粗集中，只有完全包含于某个概念的等价类才属于集合X，并没有考虑到规则的容错性，这就需要引进条件概率、概率粗集等相关概念。Yao在文献2，7中论述决策粗糙集可转换为各种概率粗糙集。下面介绍相关决策粗集的基本概念和定义。定义1 令 Pr (Xx) 表示任何一个实体属于x的条件属性X的条件概率。Pr(X| x )=| x X| x ，|•|表示集合中元素的基数。定义2 用一对概率阈值来定义概率正、负和边界域。设 01，则（，）概率正、负和边界域为： POS (，) （X

6、i|x) (3) 贝叶斯决策论很广泛的应用于多个领域。决策粗糙集可以认为是贝叶斯决策理论的一个简单应用，其描述如下：一个子集 C U ，可以构造一个含两个状态的集合 =C,C c ，对应于粗糙集的三个域，我们可以构造一个决策动作集 A=a P,a B,a N ，其中， a P ， a B 和 a N 分别代表一个对象分类的动作，即，选择 xPOS(C),xBND(C) 或 xNEG(C) 。不同的决策会引导不同的分类错误，也将产生不同的后果。这可以由一个32的矩阵表示，如表1所示：其中， PP ， BP 和-NP分别表示当一个对象属于集合 C 时，采用动作 a P ， a B 和 a N 的

9、B): If Pr (C|x) and Pr (C|x) ，decide xBND(C) ； (N): If Pr (C|x) and Pr (C|x) ，decide xNEG(C) ；其中，，和记为： = PN BN ( PN BN )+( BP PP ) = BN NN ( BN NN )+( NP BP ) = PN NN ( PN NN )+( NP PP ) (6) 在损失函数中如果增加一个条件： (PB)N (NB)P (BN)N (BP)P ，可以得到。由 (PB)N (NB)P (BN)N (BP)P (PB)N (BN)N (BP)P (NB)P (NB)P (B

10、N)N (BP)P (PB)N ，即有 0 。决策规则仅用和来定义： (P): If Pr (C|x) ，decide xPOS(C) ； (B): If Pr (C|x) ，decide xBND(C) ； (N): If Pr (C|x) ，decide xNEG(C) ； (7) 决策粗糙集模型不仅基于概率模型，而且阈值都是可计算得到的。正因如此，决策粗糙集更能代表一般的概率粗糙集思想。 1.2 三枝决策的决策粗糙集理论在决策粗糙集理论中，论域和被划分为3个区域，这3个区域对应了3个规则，我们把这3个规则称为 (,) 三枝决策规则。如图1所示，具体的说： X发生的概率大于阈值

11、，即从正域里获取的规则（正规则），用来接受某事物(accep tan ce)； X发生概率小于阈值，即从负域里获取规则（负规则），用来表示拒绝某事物(rejection)； X发生的概率介于阈值和之间，即落在边界域上的规则（边界规则），表示需要进一步观察,即延迟决策(deferment)。2 决策粗糙集理论的约简属性约简是粗糙集理论的核心。约简是用来解决冗余或者可忽视的知识的问题，直观地说，属性约简就是从条件属性中发现部分必要的条件属性，使这部分条件属性和所有条件属性相对于决策属性有相同的分类能力。 2.1 Pawlak约简 Pawlak约简 R C 和决策属性D是密切相关的，它被定义

12、为正域不变的独立条件属性子集。为条件属性集， D=D 1,D 2,.,D m 为决策属性划分， C 为条件属性划分。假设一个信息表 S=(U,At=CD,V a|aA t,I a|aA t) ，一个属性集 R C 是C关于D的一个pawlak约简，则它满足如下2个条件：（s）正域不变性： POS R ( D)=POS C ( D) （n）独立性： aR,POS Ra ( D)POS C ( D) (8) 在Pawlak粗糙集模型的约简中，我们看到了2个极端置信度。根据Pawlk粗糙集中正域的定义，正规则的置信度（confidence）为1。对于边界规则，它的置信度大于等于0，它是最小的置信

13、度值。 R C 是C关于D的一个pawlak约简，则 POS R ( D)BND R ( D)= ； POS R ( D)BND R ( D)=U 。 POS R ( D)=POS C ( D) 等价于 BND R ( D)=BND C ( D) 。因此，在Pawlak约简中存在隐含的相同的边界域。 2.2 概率粗糙集模型约简通过对Pawlak粗糙集模型约简的学习和分析，发现该属性约简方法不适合概率粗糙集模型，我们定义概率粗糙集模型的属性约简，假设决定一个信息表， S=(U,At=CD,V a|aA t,I a|aA t) 一个属性集 R C 是C关于D的一个约简，则它满足如下2个条件：（

14、s）正域不变性： POS- R(,) (-D)=POS- C(,) (-D) （n）独立性： aR,POS R-a(,) ( D)POS C- (,) ( D) (9) 概率粗糙集模型域的定义等价类 x 和决策类的交集不为空，即 xD max (x) 。负规则x-PD-max(x)由阈值决定，边界规则x-BD-max(x)由阈值决定。阈值可以不是最大值1，可以不是最小值0。在概率粗糙集模型中， R C 是C关于D的一个约简，则 POS R ( D)BND R ( D)U ，因此，在约简时，我们可以需要考虑正区域的概率和边界域的概率。 2.3 决策粗糙集约简在Pawlak粗糙集模型中，由于正域具有相对于条件属性的单调性，约简只需保证条件属性相对决策属性的依赖度不变。然而，在决策粗糙集模型中，正域不再具有相对于条件属性的单调性，仅保持依赖度不变不能作为决策粗

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
特别说明：	请自助下载，系统不会自动发送文件的哦；如果您已付费，想二次下载，请登录后访问：我的下载记录
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？