基于军事知识图谱的问答系统_窦小强.docx

上传人:wj 文档编号:104255 上传时间:2022-10-03 格式:DOCX 页数:5 大小:78.81KB
下载 相关 举报
基于军事知识图谱的问答系统_窦小强.docx_第1页
第1页 / 共5页
基于军事知识图谱的问答系统_窦小强.docx_第2页
第2页 / 共5页
基于军事知识图谱的问答系统_窦小强.docx_第3页
第3页 / 共5页
基于军事知识图谱的问答系统_窦小强.docx_第4页
第4页 / 共5页
基于军事知识图谱的问答系统_窦小强.docx_第5页
第5页 / 共5页
亲,该文档总共5页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

基于军事知识图谱的问答系统_窦小强.docx

《基于军事知识图谱的问答系统_窦小强.docx》由会员分享,可在线阅读,更多相关《基于军事知识图谱的问答系统_窦小强.docx(5页珍藏版)》请在冰豆网上搜索。

基于军事知识图谱的问答系统_窦小强.docx

基于军事知识图谱的问答系统

窦小强1,刘天雅2,张志政3

(1.国防科工局经济技术发展中心建设处,北京100081,2,中国电子科技集团公司第二十八研究所,

江苏南京211189;3.东南大学计算机科学与工程学院,江苏南京211189)

摘要:

研发具备大规模军事知识的智能问答系统是能够提高军事决策智能化和便捷化的途径之一,本文介绍了一个基于军事知识的智能问答系统,该系统首先利用多源军事知识构建了军事领域的知识图谱,采用自然语言处理技术实现了自然语言问题的理解,基于智能推理实现了问题答案的生成和组织,实现了部分军事问题上的直接问答,以及部分问题上基于交互的问答

关键词:

智能问答;知识图谱;语义网

QuestionAnsweringSystemBasedonMilitaryKnowledgeGraph

DOUXiao-qiang1,LIUTian-ya2,ZHANGZhi-zheng2

(1.EconomicandtechnologicaldevelopmentcenterofStateAdministrationofScience,TechnologyandIndustryfor

NationalDefense,Beijing100081;2.NanjinginstituteofElectronicEngineering,NanjingJiangsu210007;3.School

ofComputerScienceandEngineering,SoutheastUniversity,NanjingJiangsu211189)

Abstract:

Researchingquestionansweringsystemswithlarge-scalemilitaryknowledgeisoneofthewaytoimprovetheintelligenceandconvenienceofmilitarydecisionmaking.ThisPaperintroducesaquestionansweringsystembasedonmilitaryknowledgegraphwhichwasconstructedfrommulti-sourceknowledge.Inthesystem,naturallanguageprocessingtechniquesareadoptedtoachievequestionanalysis,andthegenerationandorganizationofanswerarebasedonintelligentinferencetechniques.Thesystemcananswermostmilitaryquestionsdirectlyandanswersomeofthequestionsininteractionwithusers.

Keywords:

QuestionAnswering;KnowledgeGraph;SemanticWeb

0引言

随着互联网中信息的爆炸式增长,通过搜索引擎检索结果已经越来越难以满足用户对确切答案的需求。

在这样的背景下,支持自然语言形式提问的问答系统成为当前国内外的一个重点研究方向。

问答系统具有能确切表达用户的知识需求以及用户友好的特点,从而进一步提高了知识获取的便利性。

当前的Web数据正在从大量的互相链接的网页数据和开放知识源逐渐演变为知识图谱的形式,为充分大量多源异构的知识,构建知识图谱成为知识表示和存储的一种重要方法。

知识图谱中用图的形式来建模现实世界中的知识,具体表现为RDF/RDFs三元组的形式,其中一、三元对应图中的节点,第二元对应图中的边,节点一般为概念或者实例,而边则为这些概念、节点之间存在的关系。

目前已经现存大量的知识图谱,如:

GoogleGraph"〕、DBpedia[2\百度知心等,通过对知识图谱进行图操作,用户可以获取丰富的与所感兴趣的概念、实例有关的知识。

随着知识图谱资源的日益丰富,以知识图谱作为知识源的问答也成为自动问答领域的一个热点,研究基于知识图谱的问答技术,将极大地帮助人们从已有的知识中获取需要的答案。

各大搜索引擎也在研究使用基于知识图谱的技术提升用户的检索体验,如:

谷歌搜索引擎构造了GoogleGraph用于辅助搜索。

目前已经存在大量基于知识图谱的智能问答系统,这些问答系统旨在利用丰富的知识图谱中的知识,使不了解知识查询语言、不熟悉知识库内容的用户能够无障碍地用自然语言查找需要的知识B41。

AquaLog[5]使用了模板方法来对用户问题进行解析。

系统对句子做了浅层语法分析后,模板库中的规再进一步依据单词词性将句子切分为不同的成分,再根据问句中这些成分出现的先后顺序以及句中包含的某则些关键词、疑问词等特点用模板对问题进行分类,得到了中间二元组,这些二元组最终被映射成知识图谱中的二元组AquaLog在实体链接中加入了用户交互消歧的方式来选择映射关系,并记录用户的选择以及选择的上下文来从中学习,以增强系统关系链接的能力。

但是AquaLog缺乏对复杂问题的处理能力。

TBSL问答系统时依据对句法树的分析结果,结合领域无关词典自动生成了SPARQL模板,再通过RDF资源映射结果实例化SPARQL模板,从而达到查询解题的目的。

Xser®是一个基于DBpedia的问答系统,该系统首先使用结构感知器算法和使用集束搜索算法得到最优的有向无环图,并用全局最优的RDF资源实例化有向无环图来进行问题理解o该系统未考虑对复杂问题的回答,需要大量的问答对作支撑。

FerrAndez凶等利用文本蕴含的方法实现了一个基于电影本体的西班牙语问答系统QCID,与其他基于机器学习的问答方法类似,该系统所需采集的问题数量随着知识库规模增大而急剧增长。

在国内,张克亮等闵提出了一个面向航空领域的问答系统,该系统按照知识图谱中的实体在用户问句中出现的顺序、答案的实体类型以及几种问句修饰词将用户问题分成了12类,每一类问题包含不同的巳知条件、未知条件和答案类型。

该系统假定用户输入的句子中词语与RDF资源名字一致,从而经过简单的RDF资源映射便可确定问题类型,进而实例化该类问题对应的SPARQL模板。

但是其对问题的分类方法简单,会出现多个意思相同问法不同的句子被分到了不同类别的情况。

杜泽宇廿°]等实现了一个基于知识图谱的电商领域问答系统,该系统首先使用SVM算法对问题进行分类,然后通过语法分析得到中间三元组形式的语义槽,将语义槽的特点与问题类别结合生成SPARQL模板,再将中间三元组链接到RDF资源的结果实例化SPARQL模板,该问答系统实现了对复杂问题的解答。

在军事领域中,人们对于精确检索答案的需求更加强烈,构建军事知识图谱,并在其基础上,实现相应的智能问答,将极大促进军事决策的智能程度和便捷性。

本文在一个基于军事知识图谱的问答系统研发实践为基础上,总结了相关方法和技术。

首先介绍军事领域基于知识图谱的问答系统的特点,研发的难点,其次介绍构建军事领域的知识图谱的关键技术和环节,然后,介绍了军事问答系统的整体架构和问题理解、问题求解、答案生产等各个主要环节的相关技术,通过典型例了展示了系统的主要功能,最后进行了展望。

1军事问答的特点

与现有常见的开放领域问答系统相比,军事领域的问答系统具有显著的领域特点〔"],这也给军事问答系统的研发带来了难题。

与开放领域问答系统相比,军事领域问答的显著特点包括:

(1) 与面向大众的开放域问答相比,军事领域的问题形式相对有限,亦即同样问题的问法的多样性少于开放域问题;

(2) 与目前具备大量开放知识源的开放域问答相比,缺乏开放的专门知识源;

(3) 开放领域大量问题答案往往通过FQA的方式保存在互联网空间,很多问题可以通过普通的检索就能得到;

(4) 军事领域问题的理解和回答需要深入利用专门军事知识,通过深度推理准确理解问题和生成答案。

因此,军事问答的难点在于知识图谱的构建和面向问题求解的推理。

2军事知识图谱构建

军事知识来源多样,互联网开放知识源能够提供大量基本的军事常识,例如兵器的分门别类、所属国别等,爬取开放互联网网页和开放知识源,通过文本的结构化处理,可以获取大量的“浅”层军事常识。

目前,更多的军事知识,特别是“深”层军事知识是包含在不同军事信息系统中的专门的数据库中。

不同来源的知识图谱具有异构性,它们各自对应的模式层会出现不一致的情况。

此外,面向在线问答,需要对大规模军事知识进行可靠的存储和高效的检索。

因此在构建军事知识图谱中主要要解决的难题包括:

(1) 不同来源知识到RDF规范的转化;

(2) 超出RDF表示能力的“深层”军事知识的表示;

(3) 不同知识的语义一致性处理;

(4) 军事知识图谱的可靠存储和高效检索。

对此,我们提出了一系列的应对技术,包括:

(1) 建立了一个标准的模式层的分类体系,自动转化得到的模式层通过上下位等关系与标准模式层建立联系,以实现异构知识图谱之间的语义统一。

(2) 定义了提出了多知识表示形式联合的知识模型,定义了浅层知识到RDF的编译方法。

(3) 直接以RDF形式存放由于图数据库与知识图谱二者都有相似的图结构,而且图数据库的查询比文件更高效,并支持空间计算的功能,便于后续的问答扩展,本文选择了图数据库作为知识图谱的存储方式。

存储知识图谱时,我们将知识图谱的图模型中的节点和边一一对应到了图数据库的节点和边上,确保知识图谱的语义信息不会丢失,同时该数据建模过程也兼顾了知识查询的可操作性和高效性。

知识图谱存储完成之后,对于知识图谱的查询可通过图数据库上的查询语句执行实现。

3问答系统整体架构

本问答系统主要由问题理解、问题求解和答案生成三个模块构成。

其中问题理解模块对输入的用户问题进行解析,抽取出求解该问题必需的语义信息,问题求解模块则将问题理解的结果转换成图数据库的查询,最终答案生成模块将查询结果转化成了自然语言形式的答案返回给用户。

由于基于知识图谱的智能问答是在知识图谱的基础上进行的,问题求解也最终体现为知识图谱上的查询,所以问题理解模块的关键是将用户问题映射到知识图谱上的实体,并表达出用户的查询意图,这两者即构成了问题中待抽取的语义信息。

系统的总体流程如图1所示,用户问题首先经过浅层语法分析进行分词,得到的结果作为问题分类的输入;问题的类别识别出后,问题的部分用户意图便已识别出,问题中的对知识图谱的指称也被抽取出来,指称被链接到知识图谱中具体的实体;问题理解的结果对图数据库查询模板进行实例化,生成具体的查询语句,得到的查询结果由答案生成模板加工成自然语言形式的答案返回给用户。

图1系统流程图

4关键技术

4.1问题理解

由于用户问题针对的是知识图谱中的实体,所以用户的提问总是可以根据知识图谱中的元素拆分开。

我们通过分析,将需要回答的用户问题分为了若干类,如:

问某一类事物在某一方面的属性的最值、判断一个实例与另一个实例之间是否存在某个关系,这两类问题的样例分别如下。

四代机的最大航速是多少?

布什号航空母舰上装配了弹道导弹吗?

用户问题首先通过浅层句法分析,生成对句子中的分词、词性标注结果,这些结果被输入到问题模板中。

对于每一类问题,我们实现了相对应的问题模板来描述该类问题的特点,用于识别该类问题,并同时

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 人文社科 > 法律资料

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1