中医药知识库设计与实现.pdf

上传人:wj 文档编号:3435523 上传时间:2023-05-05 格式:PDF 页数:64 大小:7.14MB
下载 相关 举报
中医药知识库设计与实现.pdf_第1页
第1页 / 共64页
中医药知识库设计与实现.pdf_第2页
第2页 / 共64页
中医药知识库设计与实现.pdf_第3页
第3页 / 共64页
中医药知识库设计与实现.pdf_第4页
第4页 / 共64页
中医药知识库设计与实现.pdf_第5页
第5页 / 共64页
中医药知识库设计与实现.pdf_第6页
第6页 / 共64页
中医药知识库设计与实现.pdf_第7页
第7页 / 共64页
中医药知识库设计与实现.pdf_第8页
第8页 / 共64页
中医药知识库设计与实现.pdf_第9页
第9页 / 共64页
中医药知识库设计与实现.pdf_第10页
第10页 / 共64页
中医药知识库设计与实现.pdf_第11页
第11页 / 共64页
中医药知识库设计与实现.pdf_第12页
第12页 / 共64页
中医药知识库设计与实现.pdf_第13页
第13页 / 共64页
中医药知识库设计与实现.pdf_第14页
第14页 / 共64页
中医药知识库设计与实现.pdf_第15页
第15页 / 共64页
中医药知识库设计与实现.pdf_第16页
第16页 / 共64页
中医药知识库设计与实现.pdf_第17页
第17页 / 共64页
中医药知识库设计与实现.pdf_第18页
第18页 / 共64页
中医药知识库设计与实现.pdf_第19页
第19页 / 共64页
中医药知识库设计与实现.pdf_第20页
第20页 / 共64页
亲,该文档总共64页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

中医药知识库设计与实现.pdf

《中医药知识库设计与实现.pdf》由会员分享,可在线阅读,更多相关《中医药知识库设计与实现.pdf(64页珍藏版)》请在冰点文库上搜索。

中医药知识库设计与实现.pdf

沈阳航空航天大学硕士学位论文中医药知识库设计与实现姓名:

张五辈申请学位级别:

硕士专业:

计算机应用技术指导教师:

张桂平201101沈阳航空航天大学硕士学位论文摘要中医药学具有数千年的历史,它是中国人民数千年与疾病做斗争的智慧结晶。

经过数千年的发展,无论理论体系还是治疗方法和手段都取得了长足的发展,近年来,中医药学出现了中医药学数字资源缺乏统一的描述、传承危机等问题。

知识库是领域信息的模型化表示,构建知识库有利于中医药资源的传承、有利于利用数据挖掘技术探求中医药诊治疾病的规律、有利于发现中医的诊治规律,并创新诊治模式,提高诊疗水平。

本文在分析中医药主要研究内容的基础上,着重研究了中医药知识库的设计与实现,主要工作包括以下几个方面:

1在对中医药基本理论和中医药主要研究内容充分调研的基础上,设计了一个中医药知识库构建体系。

从整体上,中医药知识库包括基本理论库和实例库:

2在设计的中医药知识库体系基础上,根据不同类型的知识特点设计中医药知识的表示形式。

本文分别采了框架和三元组的知识表示形式表示实例库、基本概念库和规则库中的知识;3针对中药和方剂库的构建,提出一种基于网络的中医药知识获取方法,完成中药库和方剂库的构建;4针对知识库中新知识的获取问题,提出了一种从中医药文献中获取知识的方法,该方法将卡方检验的特征引入到基于条件随机场的术语抽取中,该方法通过对字符串左右词与当前词之间的结合度的考察来识别术语,该方法既考虑到卡方检验在检验字符串内部的结合紧密度的优良特点,也考虑到条件随机场在识别低频术语的优点,有效的避免了传统方法在识别低频术语方面的劣势。

关键词:

中医药知识库;知识表示;术语抽取;卡方检验;条件随机场沈阳航空航天大学硕士学位论文AbstractTraditionalChineseMedicinehasthousandsofyearsofhistoryItiswisdomofChinesepeopletofightwithdiseaseforthousandsofyearsAfterseveralyearsofdevelopment,whetherortheoreticalsystemandmeansoftreatmenthavemadegreatprocessInrecentyear,TraditionalChineseMedicineappearssomeissuessuchaslackofanunifieddescriptionofdigitalresources,heritagecrisisKnowledgebaseisamodelrepresentationofthedomaininformationConstructingtheknowledgebaseisconductivetothetransmissionofTraditionalchinesemedicineresource,isconductivetousedataminingtechniquestoexplorethelawsofdiseasediagnosis,isconductivetodiscoverthelawofTraditionalChineseMedicinetreatmentandinnovativetotreatmentmodeltoimprovethediagnosisandtreatmentBasedoninvestigatingthemaincontentofTraditionalChineseMedicine,mainlyresearchesthedesignandrealizationofTraditionalChineseMedicineknowledgedatabaseThispapermainlyincludesthefollowingparts:

Firstly,basedonfullyinvestigatingthebasictheoryandmainlyresearchingcontentoftraditionalChinesemedicine,thispaperdesignsaconfigurationsystemoftraditionalChinesemedicineknowledgeAsawhole,traditionalChinesemedicineknowledgedatabaseincludesbasictheoryandinstanceknowledgebaseSecondly,basedondesigningthesystemoftraditionalChinesemedicineknowledgedatabase,wedesigntherepresentationofTraditionalChineseMedicineknowledgeaccordingtoknowledgefeaturesofdifferenttypesThispaperusesknowledgeframetorepresenttheknowledgeoftheinstanceknowledgebaseandthebasicconceptsbase,andusesthreeobjectstorepresenttheknowledgeoftherulesbaseThirdly,aimingatconstructionoftheTraditionalChineseMedicineandprescriptionknowledgebase,thispaperputsforwardtoaknowledgeacquisitionmethodofTraditionalChineseMedicineknowledgebasedonthenetworkThispaperaccomplishesthetraditionalChinesemedicineandprescriptionknowledgebaseFourthly,aimingatacquiringmoreknowledge,thepaperintroducesthechi-squaretestII沈阳航空航天大学硕士学位论文featureintotermrecognitionbasedonCRF,andthismethodrecognizestermsbycombinationdegreebetweenleftandrightwordsofcharacterstringsandpresentwordsThemethodnotonlyconsiderstheadvantagesofthecombinationdegreeofchi-squaretestintestingcharacterstrings,butalsoconsiderstheadvantagesofCRYforrecognizingtermsoflowfrequencyThus,thedisadvantagesofthetraditionalmethodsappliedinthetermrecognitionareavoidedeffectivelyKeywords:

TraditionalChineseMedicalKnowledgeBase;KnowledgeRepresent;TermExtract;theChi-squareTest;CRFIII沈阳航空航天大学硕士学位论文第1章引言中医药学具有数千年的悠久历史,它是中国人民数千年与疾病做斗争的智慧结晶。

中医药学在保证国人以及世界人民的健康方面起到了不可磨灭的作用。

多年来中医以及中药专家在中药、中医理论、中医所属各科疾病、针灸、经络等方面进行了不懈的努力,并且取得了显著的成就。

然而,近年来,中医药学出现了中医药学数字资源缺乏统一的描述、传承危机等问题。

对此,国家提出了“基于肾藏精的脏象理论基础研究”项目,而本课题“中医药知识库设计与实现”就来源于该项目。

11研究背景与意义111研究背景中医药学是中华民族优秀文化的重要组成部分,为中华民族的繁衍昌盛做出了巨大贡献。

传统中医药是全人类的共同财富,是中国人民数千年与疾病做斗争的智慧结晶,经过数千年的发展,无论理论体系还是治疗方法和手段都取得了长足的发展。

中医药学是我国生命科学领域最具自主创新能力的领域【1,经过广大中医药科研人员的努力,取得了具有知识产权,领先于世界先进水平的中医药技术成果,比如,对中医“证”的现代科学基础、针灸镇痛原理和经络的研究以及中药复方作用机理的深入认识,对中医四诊中脉诊、舌诊、面诊的定量研究,中医药对特殊病、疑难杂症治疗的特殊疗效,中药活血化瘀治疗心脑血管病的重大疗效,外固定方法治疗骨折。

随着社会文化环境的变化,中医药学的传承面临着挑战,主要表现在以下几个方面:

(1)在医疗方面,由于经济利益的趋势,一些传统的非常有效的针灸、诊疗方法没有得到有效的继承和充分的利用;

(2)名老中医的学术思想没有得到有效的弘扬和传承;(3)中药饮片质量没有得到有效的保障,使用量也大幅度下降;(4)有些传统的中药加工炮制方法失传。

目前,越来越多的相关学科的人员对中医药现代化产生了兴趣,并有意参与到中沈阳航空航天大学硕士学位论文第1章引言中医药学具有数千年的悠久历史,它是中国人民数千年与疾病做斗争的智慧结晶。

中医药学在保证国人以及世界人民的健康方面起到了不可磨灭的作用。

多年来中医以及中药专家在中药、中医理论、中医所属各科疾病、针灸、经络等方面进行了不懈的努力,并且取得了显著的成就。

然而,近年来,中医药学出现了中医药学数字资源缺乏统一的描述、传承危机等问题。

对此,国家提出了“基于肾藏精的脏象理论基础研究”项目,而本课题“中医药知识库设计与实现”就来源于该项目。

11研究背景与意义111研究背景中医药学是中华民族优秀文化的重要组成部分,为中华民族的繁衍昌盛做出了巨大贡献。

传统中医药是全人类的共同财富,是中国人民数千年与疾病做斗争的智慧结晶,经过数千年的发展,无论理论体系还是治疗方法和手段都取得了长足的发展。

中医药学是我国生命科学领域最具自主创新能力的领域【1,经过广大中医药科研人员的努力,取得了具有知识产权,领先于世界先进水平的中医药技术成果,比如,对中医“证”的现代科学基础、针灸镇痛原理和经络的研究以及中药复方作用机理的深入认识,对中医四诊中脉诊、舌诊、面诊的定量研究,中医药对特殊病、疑难杂症治疗的特殊疗效,中药活血化瘀治疗心脑血管病的重大疗效,外固定方法治疗骨折。

随着社会文化环境的变化,中医药学的传承面临着挑战,主要表现在以下几个方面:

(1)在医疗方面,由于经济利益的趋势,一些传统的非常有效的针灸、诊疗方法没有得到有效的继承和充分的利用;

(2)名老中医的学术思想没有得到有效的弘扬和传承;(3)中药饮片质量没有得到有效的保障,使用量也大幅度下降;(4)有些传统的中药加工炮制方法失传。

目前,越来越多的相关学科的人员对中医药现代化产生了兴趣,并有意参与到中沈阳航空航天大学硕士学位论文医药的相关研究中来,这为中医药知识的创新发展提供了良好的条件和难得的机遇。

加强对中医药的知识体系、学术本质、思想精髓以及特色优势的阐述和传承,从而引导人们创新的方向,使中医药创新真正有利于中医药的发展。

112选题意义知识库是对领域信息的模型化表示,能够实现中医药知识的共享、重用和传承。

目前,知识库构建方法研究成为了知识工程的研究热点,它在各个领域都得到了广泛应用,如中医领域、数字图书馆、情报学、航空、语言学、学科学、信息检索、交通、机械、智能系统、产品设计、教学管理、企业管理、电网、客户服务机构、专家系统、教育学、法律,特别是在中医领域,应用更加广泛,其主要实现知识的共享和重用、积累等,中医药知识库构建的意义体现在以下几个方面:

(1)借助中医药知识库构建快速、准确的知识检索系统;

(2)运用知识管理功能实现疾病诊疗;(3)借助中医药知识库实现知识的创新;(4)通过知识库有利于实现名老中医思想的传承。

目前中医药资源已较丰富,利用现代化的技术构建中医药知识库有利于利用数据挖掘技术探求中医药诊治疾病的规律,有助于发现中医的诊治规律,并创新诊治模式,提高诊疗水平。

12本文的主要工作本文的主要工作是根据中医药领域相关知识以及现有相关知识体系设计便于计算机表示的知识库体系,并根据这个知识体系构建中医药的知识库。

本文还针对中医领域的语言以及用词等特点研究了中医领域的术语识别方法本文的主要工作主要分为以下几部分:

(1)中医知识库体系的建立。

本文参考了中医基础理论E2-3的矢识库体系,并在同中医药专家探讨基础上规范了中医药知识库中应该包含的内容,并就相关的中医药知识进行了分类;根据知识的分类体系,并考虑到尽量减少知识边界模糊性,设计了该知识库体系;2沈阳航空航天大学硕士学位论文

(2)知识获取技术。

本文调研了知识来源,文中采取了基于网络的知识获取、基于公开性文档的知识获取和基于中医药文献的知识获取;并就基于网络的知识获取方法进行了详细的讲解;(3)基于文献的知识获取。

本文主要是从文献中抽取中医药概念。

根据中医药文献的语言特点和用词特点,对中医药领域的术语特征进行了研究,选择有利于术语识别的特征,利用条件随机场模型,通过对语料进行特征选择、特征模板选择、标注集选择确定实验参数,并对术语识别的结果进行了分析和比较。

(4)中医药知识库设计与实现。

本系统设计实现了实例库和中医基础理论库,其中,实例库包含中药库和方剂库;中医基础理论库包含中医基本概念库和规则库。

文中采用了基于框架的知识表示方法对方剂、中药和中医基本概念进行表示;规则库中的规则采用三元组知识表示形式。

本系统是在WindowsXP环境下实现的。

13本文的组织结构本论文共分为5章,具体结构如下:

第一章引言,主要介绍了中医药知识库构建的研究背景以及意义,简单阐述了中医药知识库构建的重要性,同时描述了中医药知识库的应用前景,然后介绍了本文的主要工作,最后对本文的组织结构做了介绍;第二章研究现状,对国内外主要的医学知识库做了简单介绍,其次介绍了知识库构建方法和知识表示方法,然后介绍了知识获取的主要方式,并就知识获取中术语获取的研究现状做了详细描述;第三章中医药知识库设计,通过同中医药专家探讨,设计了中医药知识库知识体系,然后对本系统涉及的知识表示形式进行了介绍,最后通过各种途径调研了中医药知识来源,并就不同来源的知识的形式进行了介绍。

第四章知识获取,文中采取了基于网络的知识获取方法、基于公开文档的知识获取方法和基于文献的知识获取,首先简单介绍了网络爬虫,对从特定网站获取中医药网页的方法进行了,并就网页内容提取的方法进行了详细阐述,然后介绍了基于公开文档的知识获取方法,通过半结构化的文档国标转换成结构化知识,根据国标的内容总结了中医药基本理论的规则,最后介绍了基于中医药文献的术语沈阳航空航天大学硕士学位论文抽取方法,并通过实验证明不同特征和不同模板对中医药术语抽取的影响,最后通过大量实验挑选出最好的模板;第五章中医药知识库实现,首先介绍了中医药知识库的开发环境和系统结构,然后就知识检索和知识获取进行了详细阐述。

4沈阳航空航天大学硕士学位论文第2章研究现状本章对目前比较成功的医学知识库做了简单介绍,然后介绍了常用的知识库构建方法、并就知识表示方法进行了阐述,最后介绍了知识获取的方式,并就知识获取中术语抽取和关系抽取的研究现状进行了介绍。

21知识库介绍20世纪80年代以来,国内外的学者以及研究者在知识工程方面做了很多工作,并且在知识库方面的研究成果已经得到大家的认可,文献4对目前比较出色的知识库做了总结,其中比较著名的知识库系统有如下列表所示:

WordNet瞄1,FrameNet陆。

73,MindNet阳剖,HowNet(知网)npl21等,在医学领域,知识库构建取得了一定的成就,本文就目前比较好的医学知识库做一个简单介绍:

(1)UMLSUMLS是由美国国立图书馆主持的医学一体化系统,该知识库是采用了本体的构建方法,以医学领域概念为中心,通过提取医学知识概念填充知识库,并将概念的相关概念、术语和词串以医学知识的内在联系为基础关联起来,构建概念的语义网络来描述概念的意义n引。

(2)NKIMedNKIMed是由国家自然科学基金资助的,它是国家基础设施NKI的子集。

采用了框架的知识表示方法。

NKIMed以疾病为核心概念,通过并发于、多见于等关系将医学概念与医学概念联系起来,每个疾病概念包含中医名称、英文名、西医病因、中医病因、症状等来描述各个概念的n4l。

(3)中医药学一体化语言系统2001年国家科技部基础性拨专项基金支持,由中国中医研究院带头集中全国30多所中医院校和科研单位,借鉴UMLS的思想构建中医药一体化语言系统。

该系统包含语义类型与语义关系。

语义类型共包含134种,它是以UMLS为基础的,重新设计和增加了中医药类型。

语义关系以中医药学科知识为主干,将各概念与其相关概念词汇按照语义关系关联起来n5】。

沈阳航空航天大学硕士学位论文22知识库构建方法中医药领域有着非常丰富的知识,要让计算机根据中医知识进行诊断,需要构建庞大的知识库。

现在主要的构建知识库的方法主要有以下方法:

(1)基于聚类方法的知识库构建天津大学冯志勇等n6|,提出了一种基于聚类的知识库构建方法。

他们提出了一种利用聚类技术构造树型结构表达零件相似性的方法。

根据零件之间的相似性建立层次结构以进行动态分类,进而构建一种有自学习能力的零件知识库。

(2)基于本体的知识库构建方法中国科学技术信息研究所的刘耀等n引,提出了基于本体的知识库构建方法。

他们对中医药本体概念描述体系自动构建所需要的数据基础进行深入研究,在全面阐述数据加工方法及技术的基础上,利用自然语言处理(NLP)理论与方法对中医药领域中已有的公认领域知识进行重构与利用。

成功实现中医药学知识描述体系的自动构建与获取,从而为中医药知识的挖掘与发现、利用奠定数据基础,并对领域本体的构建与进化进行有益的探索,为专业领域本体的自动构建提供理论依据及技术支持。

(3)基于可拓知识表示的知识库构建方法哈尔滨工业大学的钟诗胜和张艳n81,提出了一种基于可拓知识表示的知识库构建方法。

他们首先详细论述了可拓知识表示的菱形求解策略,包括可拓约束图的构建、物元拓展推理、关联函数计算和条件可拓集合的生成,开发了基于可拓知识表示及菱形求解策略的知识库系统。

并将该系统应用于水轮机选型设计,得到了比基于规则知识库系统更合理的结果。

(4)基于神经网络的知识库构建方法厦门大学吴芸等n9|,根据中医诊断推理对知识的不确定性、不完全性和逻辑推理的模糊性及“软计算”技术的特点,提出了利用“软计算”的方法构建中医诊断神经网络知识的基本设想,并在MATLAB中利用结构固定的三种神经网络模型分别粗略地构造了中医“八纲辨证”神经网络,并分析其计算结果,说明了采用神经网络技术构建知识库的可行性。

6沈阳航空航天大学硕士学位论文23知识表示知识表示是构建知识库的重要组成部分,为了提高知识管理系统问题求解的有效性,我们需要按照应用领域特征和问题求解的任务要求设计知识表示方式,这导致了多种多样的知识表示方式的开发。

常用的知

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 总结汇报 > 学习总结

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2