ImageVerifierCode 换一换
格式:DOCX , 页数:60 ,大小:2.05MB ,
资源ID:14018984      下载积分:5 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bingdoc.com/d-14018984.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(智能全文检索系统.docx)为本站会员(b****6)主动上传,冰点文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰点文库(发送邮件至service@bingdoc.com或直接QQ联系客服),我们立即给予删除!

智能全文检索系统.docx

1、智能全文检索系统智能中文信息管理系统I Search ProFor Windows X 中软英特信息技术有限责任公司软件产品说明书版 权 声 明智能中文信息管理系统I-Search Pro软件(源代码和目标代码)及所有相关的文档、手册著作权属于中软英特信息技术有限责任公司(简称“中软英特”)所有,受中华人民共和国著作权法、计算机软件保护条例等相关法律的保护。未经中软英特书面授权,任何单位和个人不得以任何形式对本系统中的任何部分出租、拷贝(除出于备份目的而复制本软件)、修改(包括对源代码及目标代码的修改、解密)、实施逆向工程(反编译、反汇编、注释)、全部或部分地抄袭有关文档,否则中软英特将保留追

2、究其民事及经济法律责任的权力。目 录目 录- - - - - - - - - - - - - - - - - - - - - - - - - - -3前 言- - - - - - - - - - - - - - - - - - - - - - - - - - -6软件功能及特点简介- - - - - - - - - - - - - - - - - - - - - - -7第一章 全文检索知识简介 1.1何谓全文检索- - - - - - - - - - - - - - - - - - - - - - - - - -11 1.2全文检索的意义和作用- - - - - - - - - - - -

3、- - - - - - - - - -11 1.3全文检索与情报检索- - - - - - - - - - - - - - - - - - - - - - -11 1.4全文检索得以发展的原因- - - - - - - - - - - - - - - - - - - - 12 1.5衡量全文检索系统性能的基本指标- - - - - - - - - - - - - - - - -12 1.6中文全文检索与英文全文检索- - - - - - - - - - - - - - - - - - -13 第二章 系统简介和系统安装、运行2.1系统简介- - - - - - - - - - - - - -

4、- - - - - - - - - - - - - -152.2软件安装- - - - - - - - - - - - - - - - - - - - - - - - - -17 2.3软件启动- - - - - - - - - - - - - - - - - - - - - - - - - - - 17 第三章 检索子系统3.1系统界面概述- - - - - - - - - - - - - - - - - - - - - - - - - -19 3.2基本使用- - - - - - - - - - - - - - - - - - - - - - - - - - - -213.3系统检索功能3

5、.3.1字符串检索- - - - - - - - - - - - - - - - - - - - - - - - -233.3.2词检索- - - - - - - - - - - - - - - - - - - - - - - - - - -243.3.3字包含检索- - - - - - - - - - - - - - - - - - - - - - - - -253.3.4联想检索- - - - - - - - - - - - - - - - - - - - - - - - - -253.3.5智能检索- - - - - - - - - - - - - - - - - - - - - - -

6、 - - 26 3.3.6限制检索范围- - - - - - - - - - - - - - - - - - - - - - - 26 3.3.7对检索结果集进行运算或操作- - - - - - - - - - - - - - - - -283.3.8其它检索功能- - - - - - - - - - - - - - - - - - - - - - - -29第四章 检索子系统使用详细说明4.1菜单体系结构及功能4.1.1菜单- - - - - - - - - - - - - - - - - - - - - - - - - - - -30 4.1.2工具条- - - - - - - - - -

7、 - - - - - - - - - - - - - - - - 33 4.1.3检索库及分类显示窗口- - - - - - - - - - - - - - - - - - - 344.1.4检索结果集显示窗口- - - - - - - - - - - - - - - - - - - - -364.1.5标题显示窗口- - - - - - - - - - - - - - - - - - - - - - - 37 4.1.6窗口快速切换条- - - - - - - - - - - - - - - - - - - - - - 38 4.1.7正文显示区- - - - - - - - - - - -

8、 - - - - - - - - - - - - 38 4.2关键对话框描述4.2.1检索对话框- - - - - - - - - - - - - - - - - - - - - - - - -38 4.2.2检索串列表对话框- - - - - - - - - - - - - - - - - - - - - -394.2.3高级检索对话框- - - - - - - - - - - - - - - - - - - - - - -414.2.4显示选项对话框- - - - - - - - - - - - - - - - - - - - - - 43 4.2.5其它标准对话框- - - - - -

9、- - - - - - - - - - - - - - - - 45第五章 I-Search Pro数据管理系统 5.1操作菜单体系结构及功能 5.1.1菜单- - - - - - - - - - - - - - - - - - - - - - - - - - - -46 5.1.2工具条- - - - - - - - - - - - - - - - - - - - - - - - - - -47 5.1.3 系统界面介绍- - - - - - - - - - - - - - - - - - - - - - 475.2利用菜单完成数据管理5.2.1 使用菜单建立数据库- - - - - - -

10、 - - - - - - - - - - - - - 48 5.3 利用菜单进行库操作5.3.1 删除库- - - - - - - - - - - - - - - - - - - - - - - - - 495.3.2 删除库中全部文章- - - - - - - - - - - - - - - - - - - - - 495.3.3 更改库名- - - - - - - - - - - - - - - - - - - - - - - - - 505.3.4 在库中增加文章- - - - - - - - - - - - - - - - - - - - - - 505.3.5增加格式化文章- - -

11、 - - - - - - - - - - - - - - - - - - - 505.3.6 加载DOC文件- - - - - - - - - - - - - - - - - - - - - - -535.3.7加载PDF文件- - - - - - - - - - - - - - - - - - - - - -535.3.8库的备份- - - - - - - - - - - - - - - - - - - - - - - -535.3.9库的恢复- - - - - - - - - - - - - - - - - - - - - - - -535.3.10库的优化- - - - - - - -

12、- - - - - - - - - - - - - - - -54 5.4 利用菜单进行各级分类操作5.4.1 增加子分类- - - - - - - - - - - - - - - - - - - - - - - 545.4.2 分类改名- - - - - - - - - - - - - - - - - - - - - - - -565.4.3删除当前分类- - - - - - - - - - - - - - - - - - - - - -56 5.4.4在各级分类中加入文章- - - - - - - - - - - - - - - - - -56 5.5联想词管理 5.5.1 增加联想词-

13、- - - - - - - - - - - - - - - - - - - - - - 575.5.2 删除联想词- - - - - - - - - - - - - - - - - - - - - - - 57 5.5.3 浏览联想词- - - - - - - - - - - - - - - - - - - - - - - 58 5.5.4 清除全部联想词- - - - - - - - - - - - - - - - - - - - - 58 5.6 选项- - - - - - - - - - - - - - - - - - - - - - - - - - - - -59 5.7 利用鼠标快捷

14、方式完成各项操作- - - - - - - - - - - - - - - -59附录:I-Search Pro展示- - - - - - - - - - - - - - - - - - - - - - 60前 言二十世纪八十年代以来,随着科技文化的发展和经济的腾飞,我国步入了信息时代。目前,我国的报社、图书馆、新闻出版、企业等单位电子数据激增,大中型数据库如IBM UDB、MICROSOFT SQL SERVER等得到了广泛的应用,光盘也成为快速传递并存贮大量信息的又一新生力量。在这种形势下,传统的手工检索方式越来越不符合发展的需要。全文检索系统则因为检索功能强大,管理方便,界面友好,操作容

15、易而越来越受到广大用户的欢迎。国外的检索软件虽然较早地得到了应用,其规模和实用性都很高,但国外的检索软件对中国用户而言有很多不适用的地方,如最多能作到汉化界面,并没有实现中文化,根本无法实现对汉语自然语言的处理等。所以,国外的全文检索软件并不适用于中国。全文检索系统拥有着广泛的需求和广阔的应用前景,而同时,国外的检索软件无法满足国内用户的需求。面对这种状况,中软英特信息技术有限责任公司(简称“中软英特”)致力于智能全文检索软件I-Search Pro的开发与应用。中软英特组织了最优秀的开发力量,不断地研究、采用最新的科学技术,大量借鉴人工智能等领域的研究成果,力求使本产品技术先进,功能完善。公

16、司于一九九九年正式推出智能中文信息管理系统I-Search Pro 。软件功能及特点简介1. 检索速度快用户事先无须对检索内容做任何标引, 即可对全文信息进行快速检索,I-Search Pro 是针对中文特性而研制的检索软件,具有极高的平均响应速度,真正作到亿万汉字秒级响应。1GB中文全文数据,100万条记录,单机平均检索速度为0.233秒。2. 超大文本数据管理能力 系统建库数量不限,每库中记录个数不限,每篇文章大小不限。截止1999年5月止,用I-Search Pro管理和检索10GB全文数据,仍未测试到检索瓶颈点。3检索手段丰富,检索策略齐备系统提供了多种检索方法,其中包括字符串检索,字

17、包含检索,词检索,联想检索,智能检索(蕴涵检索),模糊检索,以及标题检索、英文词尾模糊检索、分类名检索、日期范围内检索,专题检索和历史检索等。用户根据需要还可对多种检索条件进行逻辑与、逻辑或、逻辑非任意组合,能满足用户特殊的检索需求。字符串检索指照字面检索,如检索“的话”。词检索指以词为单元进行检索,如检索“软件”。字包含检索的结果为所检索字符串中任意字的检索结果之和,如检索“古都”,检索结果为 “古”的检索结果和“都”的检索结果之和。联想检索和智能检索详见6。 模糊检索指用户在对检索对象不能准确描述或记忆不清时可用“?”和“*”来进行模糊检索。每个“?”可代表一个汉字或ASCII字符;“*”

18、则代表若干汉字或某一字符串。4检索范围可控任何内容(包括文本信息和多媒体信息(视频和音频)均可作为检索对象。系统不设禁用词,如“THE”、“的”等,任何词或字符串均可作为检索对象。同时系统可限定检索方式(指全文检索,标题检索或分类名检索),限定检索文献库和检索文献时间范围。5. 词检索采用自动切词技术,尽显中文检索风采 系统将计算机技术与语言学成果融为一体,精确切词,理解词义,使系统具有认知能力。 例如:用户检索“华人”,系统不会将出现“中华人民共和国”的文章检索出来,用户检索“民法”,系统不会将“人民法院”检索出来等等,真正体现中文检索技术。6. 采用人工智能技术进行智能化检索 系统不仅能够

19、理解词意,还可以在理解的基础上进行联想和理解,即联想检索和智能检索(或称蕴涵检索)。 例如:联想检索查找“微机”,系统可以把“电脑”、“计算机”等词一起查出。 再例:智能检索(蕴涵检索)检索“交通工具”,便可检索出“中国汽车工业的发展”、“自行车王国的秘密”、“波音747的诞生”等库中所有的有关交通工具的文章。7. 自学习功能该功能为第四代检索产品的最新革命性技术。该功能将主动根据用户文献的内容,自动进行学习,调整检索策略,优化系统性能。一段时间后,系统的检索性能将得到显著提高。8. 真正中英文混合检索 一般的中文检查系统将英文字符作为字符串检索,用户检索“ATM”或“DEC”时,系统会将包含

20、这几个英文字母的文章都检索出来,误查率极高。而I-Search Pro具有完整的英文检索体系和混合检索机制,可以高效、准确地进行纯中文检索、纯英文检索和混合检索。 例如:“DEC”是一家公司,“COMDEC”也是一家公司,用户检索“DEC公司”时,系统不会将“COMDEC公司”检索出来。9. 划“词”检索系统支持方便实用的屏幕剪贴编辑,用户可直接对查到的文本信息和多媒体信息进行剪贴检索,做到“即得即用”。10支持多媒体信息。系统在管理超大文本的同时,直接管理图片、声音、活动影象等多媒体信息,并提供超文本浏览的功能。11支持S2等文件系统既可以根据S2文件、PS2文件、PS文件还原成文本文件,也

21、可以根据S2文件、PS2文件、PS文件再现报刊杂志的原版式风貌。12支持pdf文件和DOC文件 系统可以根据pdf文件还原成纯文本文件,也可以直接浏览pdf文件再现报刊杂志的原版式。同样,系统支持DOC文件。13.支持HTML文件 系统可以自动显示网页,以及将Html文件还原成纯文本文件。14. 数据库对接能力 系统和DB2、SQL SERVER、ORACAL、SYBASE可实现无缝连接,系统同时也支持INFOMIX及FOXPRO等数据库。15. 帐号管理、检索库管理、费用管理 系统可以对用户帐号和密码进行管理,还可以对检索库划分保密级别,相应的对用户也设置检索级别,最后,系统可设置库检索费率

22、,并管理用户检索费用(C/S)。16.应用范围广 系统支持单机检索、局域网(C/S)检索、局域网( B/S)检索、广域网(B/S)检索。同时支持AIX,SOLARIS,NT等操作系统,也可以在各种数据库上的Web服务下运行。任何应用场合的I-Search Pro数据都可以方便的制作成光盘。第一章 全文检索知识简介11 何谓全文检索 全文检索就是以文本数据为主要处理对象,根据数据资料的内容而不是外在特征来实现的信息检索手段。“文海捞针”是对全文检索的形象描述。 全文检索是信息检索发展的最前沿和目前的最高阶段。12 全文检索的意义和作用 人类进入二十世纪,科学技术以前所未有的高速度向前发展,随之而

23、来的是产生出大量的、具有反复使用价值的信息。来自统计学的报告显示,在信息传递过程中,80%的时间用来获取信息,20%的时间用来加工和产生新的信息。面对这种现状,摆在我们面前的首要任务是如何科学地、高效率地获取信息,这就是全文检索的意义所在。 全文检索的作用主要表现在以下方面:a. 促进信息资源的开发和利用b. 协助管理者作出正确的决策c. 便于继承和借鉴前人的成果,避免重复研究或走弯路d. 完善的检索设施和周到的检索服务,会节省大量时间,大大提高工作效率e. 光盘为信息交流提供了良好的途径和媒介,全文检索技术在光盘制作中的应用,大大提高了信息交流效率13 全文检索与情报检索 全文检索技术的出现

24、,导致了信息检索领域的一场革命。比起情报检索来,全文检索提供了全新的、强大的检索功能。情报检索是对数据资料的外部特征进行检索,如对数据资料的资料号、标题、作者、摘要、附录等;而全文检索不仅可以实现情报检索的全部功能,而且还能直接根据数据资料的内容进行检索,实现了支持多角度、各侧面地综合利用信息资源。14 全文检索得以发展的原因从技术角度看,全文检索技术是发现信息、分析和过滤信息、信息代理、信息安全控制等应用的主要技术基础。在应用方面,早期的情报检索应用仅限于专业情报领域。随着信息量呈爆炸性增长、信息的电子化,导致对全文检索技术的需求激增。其应用也从专业情报领域扩展到图书馆、报社、电台、电视台、

25、信息中心、大中型企业、小型办公环境、甚至是家庭等一切有电子媒体的领域。当前,微机的日益普及,使每台微机中或多或少存有一定数量的电子数据。而且, 随着Internet的发展,人们可供选择的信息激增。从Internet中下载大量的电子数据并存储于自己的微机里是很平常的事情。高效、安全地管理和使用这些电子数据,是全文检索技术和产品得以发展的源动力。15 衡量全文检索系统性能的基本指标 查全率:系统在进行某一检索时,检索出的相关资料量与系统资料库中相关资料总量的比率。 查准率:系统在进行某一检索时,检索出的相关资料数量与检索出资料总量的比率。检索到的信息要准确、实用,既不能“漏查”,也不能“误查”。

26、响应时间:又叫检索速度,是指从提交检索课题到查出资料结果所需的时间。对于动辄上1GB的海量全文数据来讲,检索速度至关重要。如果检索系统速度太慢,系统实用性就会大打折扣。最基本的检索速度是“千万汉字,秒级响应”。 收录范围:指所查找的范围,只有收录范围全面,才能保证真正的查全。 用户负担:指用户在检索过程中付出精力的总和。 输出形式:系统所检索出的资料的形式,可能是资料号、记录、文摘或全文等。输出的信息越多且便于浏览,用户越容易作出相关性判断。输出形式影响用户对查准率的容忍限度。检索指标举例说明例1:查询关键字“民法”,不能把“人民法院”查出来。否则是误查,出现分词错误。例2:查询关键字“电脑”

27、,也应把“微机”、“计算机”等查出来。否则是漏查。全文检索系统应具备联想能力。例3:查询关于华北地区的情况,应把北京的情况包括在内,因为北京属于华北地区。这要求全文检索系统有认知能力。例4:查询关键字“下岗”,由于这个词是新词,一般词典中不易找到。但检索系统应及时作出反应,不能出现明显的速度瓶颈。例5:在流行配置的微机上运行中文全文检索系统。如果在一般规模的数据中查询某一关键字,当等待的时间是以“10秒”作为时间单位时,系统并不实用。16 中文全文检索与英文全文检索1. 中文全文检索与英文全文检索的比较a. 由于自然语言体系不同,索引机制有所不同。 英文以词为单位建索引,与字母无关。 中文以字

28、为最小单位。b. 分词的实现不同 英文以空格为分词 汉字无明显分界符实现分词基于以上两点就可知道,中文全文检索比英文全文检索实现起来困难得多。2关于英文全文检索软件的汉化产品英文全文检索技术和产品在国外应用比国内稍早,其软件工程的效率和质量较高,软件的商品化工作做得较好。不过,目前在国内极少看到英文全文检索软件在有效地应用。究其原因,英文全文检索软件的汉化产品至多能作到“界面汉化”,无法作到“内核中文化”,因此,很难实现对汉语自然语言的处理。这是汉语自然语言形成的屏障,英文全文检索在技术上很难逾越,其汉化产品的实用性无从谈起。目前,英文全文检索软件的汉化产品对汉语并不适用。第二章 系统简介和安

29、装、运行2.1 系统简介 智能中文信息管理系统I-Search Pro是中软英特开发、具有自主版权的中文全文检索系统。它是针对中文自然语言的特点,大量借鉴计算机技术、通讯网络技术、人工智能、汉语语言学、情报学、图书馆学等多学科多领域的成熟理论和技术而实现的智能型第五代中文全文检索系统。I-Search Pro真正实现了中文全文检索的“快、准、全”。智能中文信息管理系统I-Search Pro包括基础学习版、单机版、NT(B/S)版、NT(C/S)版、UNIX(B/S)版、NOVELL版。为更好地与数据库融合,增强数据管理功能,保证数据安全性和数据一致性,I-Search Pro积极地与各大数据

30、库公司DB2、ORACAL、INFOMIX、SYBASE、SQL SERVER合作,开发出基于数据库的智能中文信息管理系统I-Search pro for DB2、I-Search pro for Sybase、I-Search pro for Oracle、I-Search pro for SQL Server等。智能中文信息管理系统I-Search Pro将随着中国信息科学和信息技术的发展一起进步。产品名称运行环境系统组件功能描述I- Search Pro 单机版P100以上,内存32兆以上,VGA256色以上显示环境,30兆以上硬盘剩余空间Windows95以上中文环境全文库管理全文库检

31、索联想词管理完成对已有数据资料的管理、检索功能I-Search Pro智能词管理P100以上,内存32兆以上,VGA256色以上显示环境,30兆以上硬盘剩余空间Windows95以上中文环境智能词条、词组管理功能,提供用户自行定义智能词配合其它版本应用(可选)I-Search Pro光盘制作P100以上,内存32兆以上,VGA256色以上显示环境,30兆以上硬盘剩余空间,较大的硬盘空间,Windows95以上中文环境将I-Sarch Pro 中的全文库整理、安排并生成模拟光盘,提供光盘上的检索安装和检索程序发布全文库,数据光盘散发的简便方法I-Search Pro UNIX B/SUNIX平台,用户数从10用户到无限用户请参见公司主页关于UNIX的说明http:/www.i-I-Search Pro NT B/SNT平台,用户数从10用户到无限用户请参见公司主页关于NT的说明http:/www.i-I-Search Pro大型数据库版本与DB2,Sybase,Oracle,SQL Server,Informix数据库对接版本,无用户数限制请参见公司主页关于

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2