什么是《知识萃取技术》.docx
《什么是《知识萃取技术》.docx》由会员分享,可在线阅读,更多相关《什么是《知识萃取技术》.docx(12页珍藏版)》请在冰豆网上搜索。
什么是《知识萃取技术》
什么是《知识萃取技术》
1
什么是知识萃取?
通俗地说,梳理知识点的内容并用一定的结构表达出来的过程,就是知识萃取。
举一个例子。
知乎上有一个提问:
如何在聚会上得体地发言?
有人总结了应景式聚会发言的万能公式:
感谢+回顾+未来愿景,并且用一个谐音表示:
赶回来
这三个方面应该具体怎么做呢?
1、“赶”:
感谢在座的听众。
① 要有全体或大部分听众
② 要有1-3个具体的关键听众。
2、“回”:
回顾过去的经历、经验、成绩、教训等。
① 以具体的小故事的方式呈现
② 如果和听众关联更好
3、“来”:
对未来的希望、祝福、梦想等。
① 提出具体的目标和期待
② 表达信心
这就是知识萃取成果的三个内容要素。
1.
知识点名称:
聚会发言万能公式
2.
3.
知识结构:
三个发言点- “赶回来”
4.
5.
知识结构的具体内容:
每个发言点都有2个要点
6.
关于知识萃取成果,可能有人会问:
知识萃取的成果需要包含案例吗?
一般来说,是需要的。
也就是说,一个知识点的萃取成果需要包含典型例证
知道了知识萃取及其成果,那么,知识成果是怎么萃取出来的呢?
一般有两类方法,一类叫归纳法,另一类叫演绎法。
下面逐一介绍一下。
2
归纳式知识萃取方法
归纳法,就是从具体的事例中总结出一般方法的过程。
也就是从事例、案例或经验中归纳总结出知识。
比如,铁轨常规故障检查中,有一种方法就是“敲打铁轨判断故障方法”。
这种方法就是总结出异常声音和潜在故障之间对照关系。
这就是从经验中总结归纳出来的知识。
归纳法是知识萃取的基础方法,现在应用很广,常见的大体是以下形式:
比如:
张老师在四川眉山观察一位川菜厨子加工一个猪肘子,将他做菜的过程总结为若干个步骤,与此同时,观察厨师每个步骤的操作要点,记录为动作的方法,这个提取的过程就是归纳式知识萃取方法。
这个过程可以归纳为一个流程步骤的结构,而每个流程步骤还可以总结出具体的操作要点。
这个整体作为一个知识点,名叫“东坡肘子料理秘笈”。
归纳式知识萃取的关键字是:
事例 + 抽象总结。
按这个逻辑,要得到知识,首先需要大量的实践事例或案例,然后才能进行归纳总结。
所以,归纳法其实就是复盘,复盘的方法不少,比如经验反馈系统,还比如美军AAR流程:
3
演绎式知识萃取
归纳法比较适合即时复盘的这种情形,也就是干完一项工作或解决一个问题之后,马上进行的经验总结活动。
课程开发时,业务部门的知识萃取往往都不是和业务事件一起进行的。
典型事例发生在很久之前,或者业务人员频繁处理一项业务工作,工作的相关技能已经熟练,内化为自己的隐性技能了。
这种情况下,业务专家其实已经可以做直接进行总结归纳了,如果先找典型案例,然后再进行知识的总结归纳反而不自然,也特别费劲。
除了萃取情境的差异之外,归纳式知识萃取也有一些先天的缺陷,那就是归纳法从一个个事例中总结出来的知识,比较碎片化,不够系统完整,而且还无法验证其准确性。
一般这样的知识,作为经验反馈问题不大,如果作为规模复制的知识,存在比较大的风险。
这也是归纳式知识萃取往往得到的是一个个“妙招”的结构性原因。
归纳法是从具体到一般的过程。
演绎法知识萃取,是从一般来具体的过程。
两者的过程是相反的。
核心是:
知识分类+知识点一般结构+事例验证。
其中,知识分类和知识点一般结构,这是知识的结构规律。
也是演绎的前提,事例验证是对知识结构的证伪。
这也是科学思维的一般过程,也就是说,知识萃取的科学方法就是演绎法。
演绎式知识萃取方法,是这么工作的:
1.
绘制知识框架,简称为绘制课程的知识图谱
2.
3.
按照知识点类别的一般结构,归纳提取知识点内容,并以合适的方式呈现出知识点的内容
4.
5.
编写案例或示例,优化1~2
6.
4
一个演绎法的案例
下面以一个实际例子进行说明:
这是一个钻井勘探相关的一个知识萃取主题,关联的工作任务是解除卡钻(钻具不能自由活动)。
场景大概类似下图这样:
(1)课程知识图谱。
一门合格的课程选题,都应该有且仅有一个知识主线。
比如说解除卡钻这个课程,是解决一个具体问题,所需要的知识往往应该包含一个流程步骤、一些动作要领/操作策略/条件参数、一组需要辨认的概念或分类、以及完成动作或辨认所需要的一些关键信息和清单模板。
以上知识点,按照知识分类进行提取组合,形成一个结构化的知识点集合,就是课程知识图谱。
【解除卡钻】是一个工作任务,其核心步骤主要有三个:
(1)判断是否发生卡钻;
(2)判断卡钻的类型;(3)解除卡钻
对这个一级结构进行分解,就可以得到如下知识图谱(7个知识点):
(2)知识点内容萃取并表达
也就是提取知识图谱中各个知识点的内容。
演绎式知识萃取,在提取知识内容方面,并不是由萃取者按自己喜好归纳,而是在知识内在结构规律的基础上进行归纳。
演绎法知识萃取中,知识分为四类,知识点的一般结构大约有11种。
萃取知识点内容,就是按照每一种类型的知识的一般结构,归纳提取内容。
下面就是一个原则类知识点的内容萃取示意图(点击可放大)。
萃取出来的知识点内容,可以按各种方式呈现表达出来。
比如下图就是将知识点内容表达为PPT的方式。
(3)编写案例,并验证。
演绎法中,提取的知识图谱和知识点内容,可以作为知识的假设,是否准确和全面系统,需要使用案例或事例进行验证。
所以,编写案例一方面是为了以后方便理解和学习,另一方面是为了对萃取的知识进行验证和优化。
比如,《解除卡钻》这个主题,业务专家编写了如下这样一个案例。
这个案例基本符合1~2步的知识成果,但讨论验证过程中,业务专家认为这个案例仅仅适合一种卡钻情境-坍塌卡钻的处理。
所以,这门课程需要加上坍塌卡钻的识别,同时,在各个步骤过程中,还需要增加一些细微但关键的作业条件和作业要点。
编写案例和案例验证,在一些比较关键的业务知识萃取时,经常需要梳理多个有差别情境的案例,以保证萃取的知识具备多数场景的可复制性。
总结一下:
1、知识萃取就是找到一个主题的知识结构和知识点内容的过程
2、知识萃取有两类方法,一类是归纳法,常见的经验反馈、复盘等方法都属于归纳法,另一类是演绎法。
3、归纳法是总结某个点的经验,适合即时场景的复盘,演绎法是根据分类知识的一般结构,先梳理出知识内容,再使用案例验证优化的方法,适合系统准确提炼岗位业务经验。