确定性因子理论theTheoryofCertaintyFactorsRead.docx

资源描述

确定性因子理论theTheoryofCertaintyFactorsRead.docx

《确定性因子理论theTheoryofCertaintyFactorsRead.docx》由会员分享，可在线阅读，更多相关《确定性因子理论theTheoryofCertaintyFactorsRead.docx（23页珍藏版）》请在冰点文库上搜索。

确定性因子理论theTheoryofCertaintyFactorsRead.docx

确定性因子理论theTheoryofCertaintyFactorsRead

第二章确定性因子理论（theTheoryofCertaintyFactors）

确定性因子理论，也被称为确定性因子，确定性因子方法。

使用确定性因子处理不确定性的方法，最初是为专家系统MYCIN开发的。

正象PROSPECTOR所处理的地质问题那样，医疗诊断问题也几乎总是受不确定性所支配。

医疗诊断与地质勘探之间的主要差异是，关于矿物的所有假说的数目是很有限的，然而关于所有可能疾病的假说却是很多很多的。

贝叶斯定理在医疗诊断中的准确使用取决于要知道许多概率值。

例如，在给定某些证据的前提下，贝叶斯定理可用于决定某患者Pa得的某一具体的疾病：

（2.1）

其中，关于j的求和遍及所有的疾病，Di表示第i种疾病，E是与Di有关的证据，P（Di）是在未获得任何证据之前患者Pa得疾病Di的先验概率，P（E|Di）是在假设疾病Di存在的前提下患者Pa显现出证据E的条件概率。

要想确定出所有这些概率值，并且所有这些被确定出的概率值又都是相互一致的，通常是极其困难的，甚至是不可能的。

实际上，证据是趋向于一件件积累的。

表达增量证据的一个贝叶斯定理的方便形式是

（2.2）

其中，E2是添加到现存证据体E1的新证据，由于E2的添加产生了新证据，

尽管公式（2.2）是精确的，但是，式中的所有概率值通常是不知道的。

并且，随着证据积聚的数量的增多，所需的概率值的数量会增加得更多，就是说情况会变得更糟。

§1信任和不信任（BeliefandDisbelief）

伴随医学专家出现的另一个问题是信任与不信任之间的关系。

乍看起来，因为显然不信任简单的是信任的反面，由此得出似乎这一问题并不重要。

但事实上，概率论要求

即

对于依赖于证据E的后验假说H，有

（2.3）

然而，当建造MYCIN的知识工程们开始访问医学专家时，知识工程们发现内科医生极其不愿意用公式（2.3）的形式去陈述他们（或她们）的知识。

例如，让我们考虑下述的一条MYCIN规则（Shortliffe，85）

（1）微生物的染色体是革兰氏阳性，并且

（2）微生物的结构是球菌，并且

（3）微生物的生长形态是链状的

THEN有一个强度为0.7的参考性证据说明该微生物的类别是链球菌

这条规则可写成后验概率形式

0.7（2.4）

其中，Ei（i=1，2，3）对应前件的三个模式。

建造MYCIN的知识工程们又发现即使当一个内科医学专家同意了公式（2.4），但他们对下述的概率结果却予以拒绝

0.7=0.3（2.5）

内科专家不同意式（2.5）说明数字0.7和0.3是信任的似然性度量，而不是信任的概率值。

这个基本问题是：

P（H|E）蕴涵了E和H之间的原因和结果关系，但E和H之间也许没有或者不一定有原因与结果关系。

如果E和H之间有原因和结果关系，并且公式P（H|E）=1－P（H|E）是正确的，那么就蕴涵着：

E和H之间也有原因和结果关系。

由于概率论的这些问题导致肖特里夫（Shortliffe，1975年）研究表达不确定性的其它方式.MYCIN方法的基础是从卡纳普（Carnap，1950年）的确认理论导出的确定因子理论。

卡纳普将概率区分成两类。

一类是与可重复事件相联系的通常所说的概率。

第二类概率被称之为认知概率（epistemicprobability）。

又因为它基于某一（或某些）证据确认一个假说，所以又被称之为确认程度（thedegreeofconfirmation）。

第二种类型的概率是信任的似然度（性）的另一个例子。

§2信任和不信任的度量

在MYCIN中，确认度最初被定义为确定因子，它是信任和不信任之间的差。

CF（H,E）=MB（H,E）－MD（H,E）其中，

CF是在证据E存在前提下关于H的确定因子，MB是由于E之存在所引起的关于H的信任增长的度量，MD是由于E之存在所引起的关于H的不信任增长的度量。

这确定因子是结合信任和不信任成为一个数（单个数）的一种方式。

结合信任和不信任成为一个数能被用于按重要性排列假说。

例如，如果一个患者有支持几种可能疾病的某些症状，则具有最高CF的疾病应该是通过排定检测首先来加以研究的疾病。

信任和不信任之度量通过概率被定义的

（2.6）

（2.7）

把1和0分别写成max[1,0]和min[1,0]是为了公式（2.6）和（2.7）之间具有对称性。

要想把MB之公式变成MD之公式，只须将MB之公式中的max换成min.

由公式（2.6）和（2.7）可得到表1中所列的结论：

表1

结论

MB,MD,CF的取值

假说肯定为真，即P（H|E）=1

MB=1,MD=0,CF=1

假说肯定为假，即P（H|E）=1

MB=0,MD=1,CF=-1

缺乏证据，P（H|E）=P（H）

MB=0,MD=0,CF=0

下图1给出了

和

之间的关系：

MB与MD满足互斥律。

因为同一个证据E不可能同时既增长了对假设H的信任，又增长了对假设H的不信任，所以我们有互斥律：

当MB[H,E]>0时，必有MD[H,E]=0；

当MD[H,E]>0时，必有MB[H,E]=0；

注意，由MB和MD之定义，有

.由互斥律可导出CF与MB和MD之间的关系：

确定性因子CF指出了基于某（或某些）证据的一个假说的纯的信任.CF取正值意味着证据支持假说，因为MB>MD.CF等于1意味着证据肯定地证明了假说.CF等于零的情况是：

由CF=MB－MD=0（zero）,推知MB=MD=0，就是说没有任何证据存在。

由CF=MB－MD=0能否推出：

MB=MD>0？

CF取负值意味着证据赞同否定假说，因为MB

不信任一个假说的理由多于信任它的理由。

例如，CF=-0.7意味着不信任比信任大0.7.CF=0.7意味着信任比不信任大0.7.

确定性因子（certaintyfactor）允许专家在没有提交关于一个假说的不信任（一个数值）的时候，去表达一个信任值，正如

CF（H,E）＋CF（H,E）=0（2.8）

这意味着：

当证据E用程度CF（H|E）确认了一个假说H时，关于假说H的确认程度却不是1CF（H|E），就是说这不是概率论所期待的。

概率论所期待的恰恰是

CF（H,E）＋CF（H,E）=1

公式（2.8）说明了证据以量Q支持一个假说H的同时，又以相同的量Q减少了对假说H的支持，以致于CF（H,E）与CF（H,E）之和为零。

例：

当某学生的最后一门课程的成绩为‘A’时，他能否获得学位？

H表示能获得学位，E表示最后一门课程的成绩为‘A’

CF（H,E）=0.70CF（H,E）=0.70（2.9）

公式（2.9）意味着：

如果他的最后一门课程的成绩为‘A’，他有70%的把握获得学位；

如果他的最后一门课程的成绩为‘A’，他有70%的把握得不到学位。

注意70%的发生是因为确定性因子被定义在区间[-1,+1]上，即-1CF（H,E）+1，其中0（zero）意味着证据不存在。

§3不确定性因子的计算

不确定性因子的值也称为不确定性值。

证据的不确定性的描述

令e代表与E有关的所有证据，把e和E分别看成一条虚拟规则的前提和结论，即

，注意：

这里CF（E,e）是E当前的不确定性值，而不是规则强度。

这正是称其为虚拟规则的原因。

当E肯定为真时，有CF（E,e）=1；

当E肯定为假时，有CF（E,e）=1；

当初始对E无知时，即用户还未获得与E有关的任何证据e时，有CF（E,e）=0；

当E以某种程度为真时，有0

当E以某种程度为假时，有1

更新命题（或证据）的不确定性值的算法

规则前件中诸证据的组合方法

表2中给出了规则前件中诸证据的组合方法，注意这里与PROSPECTOR一样，都使用了基于模糊逻辑的方法。

规则前件

规则前件的不确定性值

E2ANDE1

min{CF（E1,e）,CF（E2,e）}

E2ORE1

max{CF（E1,e）,CF（E2,e）}

NOTE

－CF（E,e）

表2e表示与前件中的证据相关的所有证据CF（E1,e）和CF（E2,e）

分别表示E1和E2的当前不确定性值

例给出某规则之前件E，E=（E1ANDE2ANDE3）OR（E4ANDNOTE5），e是与E相关的所有证据，前件E中诸Ei（i=1,2,…,5）的当前不确定性值为：

CF（E1,e）=0.9，CF（E2,e）=0.8，CF（E3,e）=0.3，CF（E4,e）=0.5，CF（E5,e）=0.4.

E之不确定性值的计算如下

E=max{min（CF（E1,e）,CF（E2,e）,CF（E3,e））,min（CF（E4,e）,-CF（E5,e））}

=max{min（0.9,0.8,0.3）,min（-0.5,-（-0.4））}

=max{0.3,-0.5}=0.3

一条规则中的不确定性值的传播

MYCIN中的规则，IFETHENHCF（H,E），其中E，H，CF（H,E）分别是规则的前件，规则之后件（或曰结论），规则强度。

规则强度表示：

当E为真（或者说，规则前件为真）时，H为真的程度。

规则也可表成：

（2.10）

作为公式（2.1.11）的例子，有规则R1：

IFE1ANDE2ANDE3THENHCF（H,E1ANDE2ANDE3），e表示与E1，E2，E3有关的所有证据，E=E1ANDE2ANDE3=E1E2E3，已知CF（H,E）=0.7，CF（E1,e）=0.5，CF（E2,e）=0.6，CF（E3,e）=0.3.

注意：

推理树（即与或树）之叶节点的不确定性值是由用户给出的。

规则R1前件的不确定性：

CF（E,e）=CF（E1E2E3,e）=min{CF（E1,e）,CF（E2,e）,CF（E3,e）}=min{0.5,0.6,0.3}=0.3>0.2，可见规则R1满足触发条件，这里的0.2表示规则触发阈值。

为何设置规则触发阈值？

？

规则R1后件（或结论）的不确定性：

CF（H,e）=CF（E,e）×CF（H,E）=0.3×0.7=0.21

两条后件相同之规则的结论的不确定性值的综合

（2.11）

如果另有一条满足触发条件的规则R2，其后件也是H，并且e*表示与规则R2之前件中的证据相关的所有证据，CF（H,e*）=0.5，那么可用公式（2.11）计算CF（H,e）=0.21和CF（H,e*）=0.5的综合结果：

CF（H,e&e*）=CF（H,e）+CF（H,e*）－CF（H,e）×CF（H,e*）=0.71－0.105=0.605

显然，公式（2.11）具有可交换性，即CF（H,e1&e2）=CF（H,e2&e1），在被综合（或组合）的结论相同的一组规则中，两两综合次序与综合结果无关。

§4MYCIN的不确定性值（或不确定性因子）计算的封闭性

CF[-1,+1]，显然只须对公式（2.11）证明封闭性。

证明：

假设有两条规则IFE1THENHCF（H,E1）和IFE2THENHCF（H,E2），e1和e2分别表示与E1和E2相关的所有证据。

a.CF（H,e1）0且CF（H,e2）0

CF（H,e1&e2）=CF（H,e1）＋CF（H,e2）－CF（H,e1）×CF（H,e2）

=CF（H,e1）×（1－CF（H,e2））＋CF（H,e2）

1－CF（H,e2）＋CF（H,e2）=1

因为CF（H,e1）×CF（H,e2）CF（H,e2），

所以CF（H,e1）＋CF（H,e2）－CF（H,e1）×CF（H,e2）CF（H,e1）＋CF（H,e2）－CF（H,e2）0

有0CF（H,e1&e2）1

b.CF（H,e1）0且CF（H,e2）0

CF（H,e1&e2）=CF（H,e1）＋CF（H,e2）＋CF（H,e1）×CF（H,e2）

=－（|CF（H,e1）|＋|CF（H,e2）|－|CF（H,e1）|×|CF（H,e2）|）

故由a.可知-1CF（H,e1&e2）0

c.CF（H,e1）×CF（H,e2）=-1

由公式（2.1.12），可知CF（H,e1&e2）=0

d.CF（H,e1）×CF（H,e2）<0并且|CF（H,e1）×CF（H,e2）|1

不妨令CF（H,e1）<0,CF（H,e2）>0

d1.假定|CF（H,e1）||CF（H,e2）|

d2.假定|CF（H,e1）||CF（H,e2）|

当|CF（H,e1）|=|CF（H,e2）|时，X=0；当|CF（H,e1）|=1时，X=-1；

故有-1X0.证毕

§5确定性因子的困难

虽然MYCIN在疾病诊断方面取得了很大的成功，但是在确定性因子的理论方面却存在着一些困难。

它的主要优点是不确定性的计算简单，信任和不信任清晰地被分开，能表达无知，CF也很直观、容易被理解。

确定性因子存在的主要困难：

有时确定性因子方法得到的CF值和条件概率值相反。

例，如果

P（H1）=0.8P（H2）=0.2P（H1|E）=0.9P（H2|E）=0.8

那么，我们有CF（H1,E）=0.5和CF（H2,E）=0.75.

确定性因子方法的一个意图是用CF值来排列，比方说疾病假说的次序，但是具有较高条件概率的假说却有较低的CF值，这是明显是一个矛盾。

在MYCIN中，未要求（从而不能保证）任一个推理链中的任意两条规则的确定性因子（规则强度）间是概率独立的。

某一个（任意一个）推理链中的任意两条规则是：

，

那么，通常有P（H|e）P（H|I）×P（I|e），其中I是基于证据e的该推理链中的一个中间假说（或假设）。

但是，在MYCIN中就认为有下式成立：

P（H|e）=P（H|I）×P（I|e）（）

在上述问题存在的情况下，MYCIN还能取得如此的成功，主要是因为比较短的推理链和比较简单的假设（或假说）缘故。

值得庆幸的是，在实际应用中相当数量的问题是能满足“比较短的推理链和比较简单的假设”的要求的。

事实上，亚当斯（Adams，1985年）具体说明了确定性因子理论实际上是标准概率论的近似。

实际应用问题常常具有较短的推理链，决不是说实际问题的解决只需一步推理，一般说来，不是很复杂的问题推理链大约不超过5步（推理树大约在5层）。

第三章基于确定性因子模型的专家系统的验证

§1引言

专家系统（ExpertSystem,ES）是一个智能程序，它能对那些需要专家知识才能解决的应用问题，包括应用难题，提供权威专家水平的解答。

ES是一种智能化的计算机程序系统，因此，在ES的建造过程中对一些技术细节必须加以认真考虑。

作为一种基于知识的系统，ES必须具有一定数量的、高水平的应用领域知识，而这些知识必须能够反映出权威专家解决问题的特点和经验。

一般说来，在建造ES之初，需要知识工程师和领域专家的密切合作，一方面权威领域专家根据所要解决的领域问题的特点，总结和整理领域知识，和知识工程师一起完成领域问题求解建模，另一方面知识工程师要构建（或选用合适的）知识表示和问题求解的形式化模型。

知识的质量和丰富程度对于ES的性能影响很大，所以对知识进行有效的评价和检测，是ES建造的关键步骤之一。

在人类的认知和推理过程中，无论是对一个事实（或曰命题、证据）的描述，还是对一条规则的刻画，都具有不确定性和/或模糊性，所以ES需要具有处理不确定性和/或模糊性问题的能力。

本文的讨论主要面对具有不确定性的领域问题。

迄今为止有代表性的不确定性处理模型主要有MYCIN模型、PROSPECTER模型、证据理论模型和贝叶斯网等等。

确定性因子理论（CertaintyFactorTheory），也被称为确定性因子，确定性因子方法，斯坦福确定性因子代数（TheStanfordCertaintyFactorAlgebra）等。

70年代中期斯坦福大学的肖特里夫（Shortliffe）等人为建造专家系统MYCIN，开展了处理不确定性的方法确定性因子理论的研究[2].

一方面，尽管在确定性因子的理论方面存在着一些困难，但由于其不确定性值的计算简单，信任

和不信任清晰地被分开，能表达无知，CF（CertaintyFactor）很直观、容易被领域专家理解，并且MYCIN在诊断等方面的应用中又取得了很大成功，所以基于确定性因子采用产生式规则表达知识的专家系统

一直有着广泛的应用。

另一方面，在确定性因子理论研究和基于确定性因子理论的专家系统的建造方面仍然有一些重要的技术细节被忽略，并且在已开发的一些专家系统中还存在着错误，如果这些问题不予以认真解决，那么对专家系统研究、建造和应用都有较大的副面影响。

由此，本文打算以不确定性处理方法和知识表示形式分别采用确定性因子理论和产生式规则的专家系统（简称为基于确定性因子的专家系统或MYCIN类专家系统）为例，侧重研究：

如何测试、评价已开发的基于确定性因子的专家系统。

§2测试、评价内容

本文打算重点测试、评价基于确定性因子的专家系统的推理机和知识库。

对推理机的测试、评价内容主要包括不确定性计算（或曰不确定性处理模型），推理控制策略，不确定性计算、推理控制策略和知识表达的关系，推理效率和准确性，不确定性计算模型的敏感性分析等。

对知识库的测试、评价主要包括知识库的一致性、完备性，规则的质量，循环推理链，规则之间的约束关系等。

这里应指出的是本文所选择的测试、评价内容是不完备的，只是较好地覆盖了应重点测试和评价的条款。

§2.1推理机的测试与评价[1-7]

1.不确定性值计算的封闭性

对于一个不确定性处理模型，其不确定性值计算的封闭性必须被证明。

特别对于新提出的模型，这一问题是绝对不能缺少的。

MYCIN的确定性因子模型的封闭性已有证明，故本文不再讨论。

2.测试证据（或事实）阈值

测试要点：

证据的存在阈值，证据的不存在阈值，证据的无知阈值；

测试方法：

●检查技术报告中是否明确设定了证据的三种阈值，若设定了则评价阈值的设定是否合理；

●检查程序实现是否与技术报告相一致：

通过分析相应的算法判断；通过合适的例子进行检测。

合理设定证据阈值的例子

在不确定性的意义下，说某证据E趋向于存在，是指该证据（或该事实）的不确定性值达到或超过某一指定的阈值。

在专家系统和知识库的建造中应认真设定证据的存在阈值。

对于MYCIN系统，一般说来：

一个证据的信度值大于等于0.2则说该证据趋向于存在（在阈值意义下，简称存在），一个证据的信度值小于等于0.2则说该证据趋向于不存在（在阈值意义下，简称不存在），一个证据的信度值在0.2与0.2之间则说对该证据趋向于无知（在阈值意义下，简称无知）。

迄今为止，有关文献仅仅提到规则触发阈值[2]。

证据阈值是证据存在阈值、证据不存在阈值和对证据无知阈值的总称。

证据阈值可由下式表达：

3.规则触发阈值[2]

测试要点：

规则触发阈值

测试方法：

●检查技术报告是否明确设定了规则触发阈值，若设定了则评价阈值的设定是否合理；

●检查程序实现的是否和技术报告相一致：

通过分析相应的算法进行判断；使用合适的例子进行检测。

规则触发阈值合理设定的例子

为了避免误差较大的观点被传播，应设定规则触发阈值，一般可设为0.2~0.3.规则被触发的条件是：

规则前件的不确定性值大于等于规则触发阈值（当触发阈值大于零时）或小于等于规则触发阈值（当触发阈值小于零时）。

证据阈值和规则触发阈值的设定，一方面提高了系统的推理效率，另一方面也避免了误差（因传播所导致）的扩大化。

4.检查是否选用了正确的综合（或曰组合）公式[1][2]

任意前件中诸证据相互独立的两条规则，若其前件不同但其后件相同，且它们的后件都是假设或中间假设，则称这两条规则具有综合关系。

在实际生活中如果人们对同一问题的看法不一致时，一般应遵循少数服从多数的原则。

这一原则应体现在规则的综合公式中。

例如，若某综合节点H汇集了三路证据，其中有两路证据支持H，另有一路证据反对H，并且这三路证据对H的支持强度或反对强度基本相同，并假定以H为后件的三条规则都满足规则触发条件，那么综合的结果就好象三路证据中仅仅有一路支持H的证据存在一样。

两条前件不同，后件（一个假设或中间假设，也称为结论或中间结论）相同之规则的结论的不确定性值的正确综合公式为：

公式中的

作为分母，保证了少数服从多数成立。

5.综合节点的匹配冲突消解

在与或树中，具有综合关系的多条（2条）规则之后件，一个假设或中间假设，被称做（与或树中的）一个综合节点。

假定以某一个综合节点为后件的规则有N条，且有M条规则满足了规则触发条件，MN，那么推理机必须确保这M条规则依序被执行，就是说这M条规则中只要有一条规则R*被执行，那么其余的M1条规则就要紧接着R*，一条紧接着一条地被执行。

检查方法：

1.分析推理机算法；2.使用合适的例子进行测试。

6.敏感性分析[4][6]

分析、测试一棵与或树的诸叶节点的不确定性值的变化对根节点的不确定性值的影响，以确定输出对输入变化的敏感程度，较好的不确定性计算模型既不应该太敏感，也不应该过于迟钝。

检测方法：

给出分析不确定性模型的方法；选择合适的数据组进行测试。

§2.2知识库的测试与评价[2][7]

1.规则强度阈值

检查知识库中的规则是否符合规定

展开阅读全文