ImageVerifierCode 换一换
格式:DOCX , 页数:5 ,大小:78.81KB ,
资源ID:369818      下载积分:1 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bingdoc.com/d-369818.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(基于军事知识图谱的问答系统_窦小强文档格式.docx)为本站会员(wj)主动上传,冰点文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰点文库(发送邮件至service@bingdoc.com或直接QQ联系客服),我们立即给予删除!

基于军事知识图谱的问答系统_窦小强文档格式.docx

1、 3 . Schoolof Computer Science and Engineering, Southeast University, Nanjing Jiangsu 211189)Abstract: Researching question answering systems with large-scale military knowledge is one of the way to improve the intelligence and convenience of military decision making. This Paper introduces a questio

2、n answering system based on military knowledge graph which was constructed from multi-source knowledge. In the system, natural language processing techniques are adopted to achieve question analysis, and the generation and organization of answer are based on intelligent inference techniques. The sys

3、tem can answer most military questions directly and answer some of the questions in interaction with users.Key words: Question Answering; Knowledge Graph; Semantic Web0引言随着互联网中信息的爆炸式增长,通过搜索引擎 检索结果已经越来越难以满足用户对确切答案的需求。 在这样的背景下,支持自然语言形式提问的问答系统成 为当前国内外的一个重点研究方向。问答系统具有能确 切表达用户的知识需求以及用户友好的特点,从而进一 步提高了知识获取

4、的便利性。当前的Web数据正在从大量的互相链接的网页数 据和开放知识源逐渐演变为知识图谱的形式,为充分大 量多源异构的知识,构建知识图谱成为知识表示和存储 的一种重要方法。知识图谱中用图的形式来建模现实世 界中的知识,具体表现为RDF/RDFs三元组的形式,其 中一、三元对应图中的节点,第二元对应图中的边,节 点一般为概念或者实例,而边则为这些概念、节点之间 存在的关系。目前已经现存大量的知识图谱,如:Google Graph、DBpedia2百度知心等,通过对知识图谱进 行图操作,用户可以获取丰富的与所感兴趣的概念、实 例有关的知识。随着知识图谱资源的日益丰富,以知识图谱作为 知识源的问答也

5、成为自动问答领域的一个热点,研究基 于知识图谱的问答技术,将极大地帮助人们从已有的知 识中获取需要的答案。各大搜索引擎也在研究使用基于 知识图谱的技术提升用户的检索体验,如:谷歌搜索引 擎构造了 Google Graph用于辅助搜索。目前已经存在大量基于知识图谱的智能问答系 统,这些问答系统旨在利用丰富的知识图谱中的知识, 使不了解知识查询语言、不熟悉知识库内容的用户能够 无障碍地用自然语言查找需要的知识B41。AquaLog5使用了模板方法来对用户问题进行解 析。系统对句子做了浅层语法分析后,模板库中的规再 进一步依据单词词性将句子切分为不同的成分,再根据 问句中这些成分出现的先后顺序以及句

6、中包含的某则 些关键词、疑问词等特点用模板对问题进行分类,得到 了中间二元组,这些二元组最终被映射成知识图谱中的 二元组AquaLog在实体链接中加入了用户交互消歧的 方式来选择映射关系,并记录用户的选择以及选择的上 下文来从中学习,以增强系统关系链接的能力。但是 AquaLog缺乏对复杂问题的处理能力。TBSL问答系统 时依据对句法树的分析结果,结合领域无关词典自动生 成了 SPARQL模板,再通过RDF资源映射结果实例化 SPARQL模板,从而达到查询解题的目的。Xser是一个基于DBpedia的问答系统,该系统首 先使用结构感知器算法和使用集束搜索算法得到最优 的有向无环图,并用全局最优

7、的RDF资源实例化有向 无环图来进行问题理解o该系统未考虑对复杂问题的回 答,需要大量的问答对作支撑。FerrAndez凶等利用文本 蕴含的方法实现了 一个基于电影本体的西班牙语问答 系统QCID,与其他基于机器学习的问答方法类似,该 系统所需采集的问题数量随着知识库规模增大而急剧 增长。在国内,张克亮等闵提出了一个面向航空领域的 问答系统,该系统按照知识图谱中的实体在用户问句 中出现的顺序、答案的实体类型以及几种问句修饰词 将用户问题分成了 12类,每一类问题包含不同的巳 知条件、未知条件和答案类型。该系统假定用户输入 的句子中词语与RDF资源名字一致,从而经过简单 的RDF资源映射便可确定

8、问题类型,进而实例化该 类问题对应的SPARQL模板。但是其对问题的分类方 法简单,会出现多个意思相同问法不同的句子被分到 了不同类别的情况。杜泽宇廿等实现了一个基于知识 图谱的电商领域问答系统,该系统首先使用SVM算 法对问题进行分类,然后通过语法分析得到中间三元 组形式的语义槽,将语义槽的特点与问题类别结合生 成SPARQL模板,再将中间三元组链接到RDF资源 的结果实例化SPARQL模板,该问答系统实现了对复 杂问题的解答。在军事领域中,人们对于精确检索答案的需求更加 强烈,构建军事知识图谱,并在其基础上,实现相应的 智能问答,将极大促进军事决策的智能程度和便捷性。本文在一个基于军事知识

9、图谱的问答系统研发实 践为基础上,总结了相关方法和技术。首先介绍军事领 域基于知识图谱的问答系统的特点,研发的难点,其次 介绍构建军事领域的知识图谱的关键技术和环节,然 后,介绍了军事问答系统的整体架构和问题理解、问题 求解、答案生产等各个主要环节的相关技术,通过典型 例了展示了系统的主要功能,最后进行了展望。1军事问答的特点与现有常见的开放领域问答系统相比,军事领域 的问答系统具有显著的领域特点,这也给军事问答系 统的研发带来了难题。与开放领域问答系统相比,军事领域问答的显著 特点包括:(1)与面向大众的开放域问答相比,军事领域的 问题形式相对有限,亦即同样问题的问法的多样性少于 开放域问题

10、;(2)与目前具备大量开放知识源的开放域问答相 比,缺乏开放的专门知识源;(3)开放领域大量问题答案往往通过FQA的方式 保存在互联网空间,很多问题可以通过普通的检索就能 得到;(4)军事领域问题的理解和回答需要深入利用专 门军事知识,通过深度推理准确理解问题和生成答案。因此,军事问答的难点在于知识图谱的构建和面 向问题求解的推理。2军事知识图谱构建军事知识来源多样,互联网开放知识源能够提供 大量基本的军事常识,例如兵器的分门别类、所属国别 等,爬取开放互联网网页和开放知识源,通过文本的结 构化处理,可以获取大量的“浅”层军事常识。目前, 更多的军事知识,特别是“深”层军事知识是包含在不 同军

11、事信息系统中的专门的数据库中。不同来源的知识 图谱具有异构性,它们各自对应的模式层会出现不一致 的情况。此外,面向在线问答,需要对大规模军事知识 进行可靠的存储和高效的检索。因此在构建军事知识图 谱中主要要解决的难题包括:(1)不同来源知识到RDF规范的转化;(2)超出RDF表示能力的“深层”军事知识的 表示;(3)不同知识的语义一致性处理;(4)军事知识图谱的可靠存储和高效检索。对此,我们提出了一系列的应对技术,包括:(1)建立了一个标准的模式层的分类体系,自动 转化得到的模式层通过上下位等关系与标准模式层建 立联系,以实现异构知识图谱之间的语义统一。(2)定义了提出了多知识表示形式联合的知

12、识模 型,定义了浅层知识到RDF的编译方法。(3)直接以RDF形式存放由于图数据库与知识图 谱二者都有相似的图结构,而且图数据库的查询比文件 更高效,并支持空间计算的功能,便于后续的问答扩展, 本文选择了图数据库作为知识图谱的存储方式。存储知 识图谱时,我们将知识图谱的图模型中的节点和边一一 对应到了图数据库的节点和边上,确保知识图谱的语 义信息不会丢失,同时该数据建模过程也兼顾了知识 查询的可操作性和高效性。知识图谱存储完成之后, 对于知识图谱的查询可通过图数据库上的查询语句执 行实现。3问答系统整体架构本问答系统主要由问题理解、问题求解和答案生 成三个模块构成。其中问题理解模块对输入的用户

13、问题 进行解析,抽取出求解该问题必需的语义信息,问题求 解模块则将问题理解的结果转换成图数据库的查询,最 终答案生成模块将查询结果转化成了自然语言形式的 答案返回给用户。由于基于知识图谱的智能问答是在知 识图谱的基础上进行的,问题求解也最终体现为知识图 谱上的查询,所以问题理解模块的关键是将用户问题映 射到知识图谱上的实体,并表达出用户的查询意图,这 两者即构成了问题中待抽取的语义信息。系统的总体流程如图1所示,用户问题首先经过 浅层语法分析进行分词,得到的结果作为问题分类的输 入;问题的类别识别出后,问题的部分用户意图便已识 别出,问题中的对知识图谱的指称也被抽取出来,指称 被链接到知识图谱

14、中具体的实体;问题理解的结果对图 数据库查询模板进行实例化,生成具体的查询语句,得 到的查询结果由答案生成模板加工成自然语言形式的 答案返回给用户。图1系统流程图4关键技术4.1问题理解由于用户问题针对的是知识图谱中的实体,所以 用户的提问总是可以根据知识图谱中的元素拆分开。我 们通过分析,将需要回答的用户问题分为了若干类,如: 问某一类事物在某一方面的属性的最值、判断一个实例 与另一个实例之间是否存在某个关系,这两类问题的样 例分别如下。四代机的最大航速是多少?布什号航空母舰上装配了弹道导弹吗?用户问题首先通过浅层句法分析,生成对句子中 的分词、词性标注结果,这些结果被输入到问题模板中。 对

15、于每一类问题,我们实现了相对应的问题模板来描述 该类问题的特点,用于识别该类问题,并同时抽取出问 题中对知识图谱中实体的指称词,即命名实体。对于问 题分类,也采用机器学习的方法,如:SVM、神经网 络等方法。我们探索和实现了对基于模板方法的改进方 法,使用朴素贝叶斯分类器进行分类,取得了一定效果, 但也受到了军事领域中标注好的问答对数量少这一现 状所限制。因为用户不了解知识图谱中的实体的具体名字, 所以句中的命名实体可能和从句中抽取出的命名实体 字面上不一致。因此我们通过字符串之间的相似度度量 方法将命名实体链接到知识图谱中的对应实体。当两个候选实体与句中命名实体之间的相似度一 样时,单纯的相

16、似度度量已经无法唯一确定对应的实 体,对此我们通过用户交互的方式来实现了消歧的目 的。当一个实体无法唯一确定时,用户将被要求自行从 候选实体中做出选择。如:“企业号是什么”这个问题 中的企业号在知识图谱中对应了多个同名实例,导 致系统无法区分,于是这多个候选实例的具有区分度的 属性和属性值被组成自然语言形式的候选项,如:请 问您问的是退役时间为1947年的企业号吗?请问您问 的是退役时间为1965年的企业号吗?,用户从中选择 选择最终确定唯一的实体。4.2问题求解和答案生成针对每一类问题,都有对应的查询和答案生成方 法。查询过程对问题理解输出的一系列实体进行判断, 并生成用户问题所对应的知识图

17、谱查询。查询结果填入 到每一类问题对应的答案生成流程,生成最终形成自然 语言形式的答案。根据答案生成的复杂度,问题被划分 为三类:(1)第一类是可以直接用查询结果作为答案的 问题,称为简单问题。(2)第二类是基于查询结果,通过逻辑推理得到 答案的问题。(3)第三类是基于查询结果,通过不确定推理得 到答案的问题,这类问题的答案往往带有不确定性度 量,例如“请问该区域飞行物是什么型号的战机? ”, 答案是一个带有置信度的战机型号的列表。答案的不确 定源于知识的不确定和证据的不确定。5系统现状5.1示例目前系统已经基本实现若干类问题的自动回答, 可以支持部分问题的交互式问答,并展示蕴含问题答案 的知

18、识图谱的可视化。示例如下:(1)最大飞行速度大于800m/s的飞行器有哪些? (列举具有特定属性值的一类实例)(2)LCA战斗机是什么?图2所示是一个列举满足属性值条件的某一类实 例的例子。图4中展示的是一个问题中包含的知识在知识图 谱中对应的子图展示界面。图2问答系统提问示例图3则是回答一个实例的定义性描述的例子。图3问答系统提问示例5.2改进方向我们将探讨对用户问题进行更加深层的语法分 析,以更灵活地解析出问题中的语义信息,并进一步探 讨人工智能的机器学习方法、智能规划和搜索等技术在 问题理解和求解等方面的应用。部分错误的回答是由多 源知识图谱中的不一致引起,因此除了对问答方法的改 进,对

19、知识图谱的不一致处理也将是下一步研究的一个 重要方向。6结束语本文利用多种来源的知识,构建了军事领域的知 识图谱,采用了适合于军事知识图谱的问题分类体系, 问题分类和语义信息抽取,并利用这些信息生成对知识 图谱进行查询,得出答案。该方法对于基于知识图谱的 限定域问答具有一定借鉴意义。(C) 1994-2021 China Academic Journal Electronic Publishing House. All rights reserved, 参考文献1Aliyu F M, Uyar A. Evaluating search features of Google Knowledge

20、Graph and Bing Satori J. Online Information Review, 2015, 39 (2): 197-213.2Mendes PN, Jakob M, Bizer C. DBpedia: A Multilingual Cross-Domain Knowledge BaseC, 2012: 1813-1817.3Wang C, Xiong M, Zhou Q, et al. Panto: A Portable natural language interface to ontologiesC. European Semantic Web Conference

21、. Springer, Berlin Heidelberg, 2007: 473-487.4Hoffner K, Walter S, Marx E, et al. Survey on challenges of question answering in the semantic web J. Semantic Web, 2017, 8(6): 895-920.5Garcia V L, Motta E, Uren V. AquaLog: An ontology-driven question answering system to interface the semantic webC. Pr

22、oceedings of the 2006 Conference of the North American Chapter of the Association for Computational Linguistics on Human Language Technology: companion volume: demonstrations.Association for Computational Lingguistics,2006: 269-272.6Unger C, Lehmann J, Ngomo A C N, et al. Template-based question ans

23、wering over RDF dataC. International Conference on World Wide Web. 2012: 639-648.7Xu K, Zhang S, Feng Y, et al. Answering Natural Language Questions via Phrasal Semantic Parsing J. Communications in Computer & Information Science, 2014, 333-344.8Ferrandez I, Izquierdo R, Ferrandez S, et al. Addressi

24、ng ontology-based question answering with collections of user queries J. Information Processing&Management 2009, 45 (2): 175-188.9张克亮,李伟刚,王慧兰.基于本体的航空领域问答系统J.中文信 息学报,2015, 29 (4): 192-198.10杜泽宇,杨燕,贺糅.基于中文知识图谱的电商领域问答系统J.计 算机应用与软件,2017, 34 (5): 153-159.11王东升,王卫民,王石,等.面向限定领域问答系统的自然语言理解 方法综述J.计算机科学,2017, 44 (8): 1-8.

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2