1、第四讲 确定性因子理论第四讲 确定性因子理论(the Theory of Certainty Factors)研究背景确定性因子理论,也被称为确定性因子,确定性因子方法。使用确定性因子处理不确定性的方法,最初是为专家系统MYCIN提出的。贝叶斯定理在医疗诊断中的准确使用取决于要知道许多概率值。例如,在给定某些证据的前提下,贝叶斯定理可用于确定某病人Pa患某种疾病的可能性: (2.1.1)其中,关于j的求和遍及所有的疾病,Di表示第i种疾病,E是与Di有关的证据,P(Di)是在未获得任何证据之前病人Pa患疾病Di的先验概率,P(E|Di)是在假设疾病Di存在的前提下病人Pa显现出证据E的条件概率
2、。 要想确定出所有这些概率值,并且所有这些被确定出的概率值又都是相互一致的,通常是极其困难的,甚至是不可能的。实际上,证据是趋向于一件件积累的。表达增量证据的一个贝叶斯定理的方便形式是 (2.1.2)其中,E2是添加到现存证据体E1的新证据,由于E2的添加产生了新证据, . 尽管公式 (2.1.2) 是精确的,但是,式中的所有概率值通常是不知道的。并且,随着证据积聚的数量的增多,所需的概率值的数量会增加得更多,就是说情况会变得更糟。1 信任和不信任(Belief and Disbelief)伴随医学专家出现的另一个问题是信任与不信任之间的关系。乍看起来,因为不信任显然简单的是信任的反面,由此得
3、出似乎这一问题并不重要。但事实上,概率论要求 即 .对于依赖于证据E的后验假说H,有 (2.1.3)然而,当建造MYCIN的知识工程们开始访问医学专家时,知识工程们发现内科医生极其不愿意用公式 (2.1.3) 的形式去陈述他们(或她们)的知识。例如,让我们考虑下述的一条MYCIN规则(Shortliffe,85)IF 1) 生物的染色体是革兰氏阳性,并且 2) 生物的结构是球菌,并且 3) 生物的生长形态是链状的THEN 有一个强度为0.7的参考性证据说明该生物的类别是链球菌这条规则可写成后验概率形式0.7 (2.1.4) 其中,Ei (i =1,2,3)对应前件的三个模式。建造MYCIN的知
4、识工程们又发现即使当一个内科医学专家同意了公式 (2.1.4) ,但他们对下述的概率结果却予以拒绝 (2.1.5)内科专家不同意式 (2.1.5) 说明数字0.7和0.3是信任的似然性度量,而不是信任的概率值。这个基本问题是:P( H | E ) 蕴涵了E和H之间的原因和结果关系,但E和 H之间也许没有或者不一定有原因与结果关系。如果 E和H之间有原因和结果关系,并且 公式P( H | E ) = 1P( H | E ) 是正确的,那么就蕴涵着:E和 H之间也有原因和结果关系。由于概率论的这些问题导致肖特里夫(Shortliffe,1975年)研究表达不确定性的其它方式。用于MYCIN的方法是
5、以从卡纳普(Carnap,1950年)的确认理论导出的确定因子为基础的。 2 信任和不信任的度量确定性因子的定义在MYCIN中,确认度最初被定义为确定因子,它是信任和不信任之间的差。CF( H , E) = MB( H , E)MD( H , E) 其中,CF是在证据E存在前提下关于H的确定因子,MB是由于E之存在所引起的关于H的信任增长的度量,MD是由于E之存在所引起的关于H的不信任增长的度量。信任和不信任之度量通过概率被定义的 (2.1.6) (2.1.7)把1和0分别写成max 1 , 0 和min 1 , 0 是为了公式(2.1.6) 和 (2.1.7) 之间具有对称性。要想把MB之公
6、式变成MD之公式,只须将MB之公式中的max换成min . 由公式(2.1.6) 和 (2.1.7) 可得到表1中所列的结论: 表 1结 论MB , MD , CF的取值假说肯定为真,即P(H | E) = 1MB = 1 , MD = 0 , CF = 1假说肯定为假,即P(H | E) = 1MB = 0 , MD = 1 , CF = 1缺乏证据,P(H | E) = P(H)MB = 0, MD = 0 , CF = 0下图1给出了和之间的关系: 0MB与MD之间的关系MB与MD满足互斥律,即: 当 MBH , E 0 时,必有MDH , E = 0 ; 当 MDH , E 0 时,必
7、有MBH , E = 0 ;含义:同一个证据E不可能同时既增长了对假设H的信任,又增长了对假设H的不信任。注意,由MB和MD之定义,有 . 由互斥律可导出CF与MB和MD之间的关系: CF值的意义确定性因子CF指出了对基于某(或某些)证据的一个假说的纯的信任。CF取正值意味着证据支持假说,因为MB MD . CF等于1意味着证据肯定地证明了假说。CF等于零意的情况是:由CF = MBMD = 0(zero), 推知MB = MD = 0,就是说没有任何证据存在。/* 由CF = MBMD = 0 能否推出:MB = MD 0 ?*/CF取负值意味着证据赞同否定假说,因为MB MD . 对此的另
8、一种解释是:不信任一个假说的理由多于信任它的理由。例如,CF = - 0.7意味着不信任比信任大 0.7 (MB=0,MD=0.7) . CF = 0.7(MB=0.7,MD=0) 意味着信任比不信任大 0.7 . 确定性因子与概率论的比较确定性因子(certainty factor)允许专家在没有提交关于一个假说的不信任(一个数值)的时候,去表达一个信任值,正如CF(H, E) CF( H, E) = 0 (2.18)这意味着:当证据E用程度CF( H | E) 确认了一个假说H时,关于假说 H的确认程度 却不是1 CF( H | E),就是说这不是概率论所期待的。概率论所期待的恰恰是CF(
9、 H , E)CF( H , E) = 1公式 (2.1.8) 说明了证据以量Q支持一个假说H的同时,又以相同的量Q减少了对假说 H的支持,以致于CF( H , E) 与CF( H , E) 之和为零。以当某学生的最后一门课程的成绩为A时,他能否获得学位为例。H表示能获得学位,E表示最后一门课程的成绩为ACF(H , E) = 0.70 CF(H , E) = 0.70 (2.1.9)公式(2.1.9) 意味着: 如果他的最后一门课程的成绩为A,他有70 % 的把握获得学位; 如果他的最后一门课程的成绩为A,他有 70 %的把握得不到学位。注意 70 % 的发生是因为确定性因子被定义在区间 -
10、1 , +1 上,即 -1 CF(H , E) +1,其中0(zero)意味着证据不存在。3 不确定性因子的计算不确定性因子的值也称为不确定性值。研究三个问题:(1) 证据的不确定性值如何表示?(2) 规则的不确定性值如何表示?(3) 不确定性如何传播? 证据的不确定性的描述令e 代表与E有关的所有证据,把e 和E 分别看成一条虚拟规则的前提和结论,即,注意:这里 CF(E , e) 是E当前的不确定性值,而不是规则强度。这正是称其为虚拟规则的原因。 当E肯定为真时,有CF(E , e) = 1; 当E肯定为假时,有CF(E , e) = 1; 当初始对E一无所知时,或用户还未获得与E有关的任
11、何证据e时,有CF(E , e) = 0; 当E以某种程度为真时,有0 CF(E , e) 1; 当E以某种程度为假时,有1 CF(E , e) 0.2 可见规则R1满足触发条件,这里的0.2表示规则触发阈值。规则R1后件(获结论)的不确定性:CF(H , e) = CF(E , e)CF(H , E) = 0.30.7 = 0.21 两条后件相同之规则的结论的不确定性值的综合E1 H CF(H, e1)E2 H CF(H, e2) (2.1.12) 如果另有一条满足触发条件的规则R2,其后件也是H,并且e* 表示与规则R2之前件中的证据相关的所有证据,CF(H , e* ) = 0.5,那么
12、可用公式 (2.1.12) 计算CF(H , e) = 0.21和CF(H , e* ) = 0.5的综合结果:CF(H , e & e* ) = CF(H , e) +CF(H , e* )CF(H , e)CF(H , e* ) = 0.710.105 = 0.605显然,公式 (2.1.12) 具有可交换性,即CF(H , e1 & e2) = CF(H , e2 & e1),在被综合(或组合)的结论相同的一组规则中,两两综合次序与综合结果无关。.4 MYCIN的不确定性值(或不确定性因子)计算的封闭性CF-1 , +1,显然只须对公式 (2.1.12) 证明封闭性。证明: 假设有两条规
13、则IF E1 THEN H CF(H , E1) 和IF E2 THEN H CF(H , E2) ,e1和e2分别表示与E1和E2相关的所有证据。a. CF(H , e1) 0且CF(H , e2)0CF(H , e1 & e2) = CF(H , e1)CF(H , e2)CF(H , e1)CF(H , e2) = CF(H , e1)(1CF(H , e2)CF(H , e2) 1CF(H , e2)CF(H , e2) = 1因为CF(H , e1)CF(H , e2) CF(H , e2) ,所以CF(H , e1)CF(H , e2)CF(H , e1)CF(H , e2) CF
14、(H , e1)CF(H , e2)CF(H , e2) 0有 0 CF(H , e1 & e2) 1b. CF(H , e1) 0且CF(H , e2) 0CF(H , e1 & e2) = CF(H , e1)CF(H , e2)CF(H , e1)CF(H , e2) = (|CF(H , e1)|CF(H , e2)|CF(H , e1)|CF(H , e2)|)故由a. 可知 1 CF(H , e1 & e2) 0c. CF(H , e1)CF(H , e2) = 1由公式 (2.1.12) ,可知CF(H , e1 & e2) = 0d. CF(H , e1)CF(H , e2)
15、0 并且 |CF(H , e1)CF(H , e2)| 1不妨令CF(H , e1) 0d1. 假定 |CF(H , e1)| |CF(H , e2)| d2. 假定 |CF(H , e1)| |CF(H , e2)| 当|CF(H , e1)| = |CF(H , e2)| 时,X = 0;当|CF(H , e1)| = 1时,X = 1;故有 1 X 0 . 证毕 RULE1: IF E1 THEN H1 (0.9) RULE2: IF E2 THEN H1 (0.8)RULE3: IF E3 THEN H1 (0.9) RULE4: IF E4 AND E5 THEN E1 (0.9)R
16、ULE5: IF E6 AND(E7 OR E8)THEN E3 (1.0)RULE6: IF E9 THEN H (0.9) RULE7: IF H1 THEN H (0.9) 部分规则集组成的与或树 输入数据: 按正确顺序手工计算的结果 5 确定性因子的困难虽然MYCIN在疾病诊断方面取得了很大的成功,但是在确定性因子的理论方面却存在着一些困难。它的主要优点是 不确定性的计算简单 信任和不信任清晰地被分开 能表达无知 CF也很直观、容易被理解。确定性因子存在的主要困难: 有时确定性因子方法得到的CF值和条件概率值相反。例,如果 P(H1 ) = 0.8 P(H2 ) = 0.2 P(H1
17、| E) = 0.9 P(H2 | E) = 0.8那么,我们有CF(H1 , E) = 0.5 和 CF(H2 , E) = 0.75 . 具有较高条件概率的假说却有较低的CF值,这是明显是一个矛盾。 规则强度的概率独立问题,在MYCIN中,未要求(从而不能保证)任一个推理链中的任意两条规则的确定性因子(规则强度)间是概率独立的。某一个推理链中的任意两条规则是: , 转化为一条规则时有:在MYCIN中就认为有下式成立:P(H | e) = P(H | I )P(I | e ) 但一般情况下 P(H | e) P(H | I )P(I | e )。 在上述问题存在的情况下,MYCIN还能取得如此的成功,主要是因为比较短的推理链和比较简单的假设(或假说)缘故。值得庆幸的是,在实际应用中相当数量的问题是能满足“比较短的推理链和比较简单的假设”的要求的。 亚当斯(Adams,1985年)具体说明了确定性因子理论实际上是标准概率论的近似。 实际应用问题常常具有较短的推理链,决不是说实际问题的解决只需一步推理,一般说来,不是很复杂的问题推理链大约不超过5步(推理树大约在5层)。
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1