湖大在职研究生信息检索考试资料.docx

上传人:b****6 文档编号:13053179 上传时间:2023-06-10 格式:DOCX 页数:55 大小:65.56KB
下载 相关 举报
湖大在职研究生信息检索考试资料.docx_第1页
第1页 / 共55页
湖大在职研究生信息检索考试资料.docx_第2页
第2页 / 共55页
湖大在职研究生信息检索考试资料.docx_第3页
第3页 / 共55页
湖大在职研究生信息检索考试资料.docx_第4页
第4页 / 共55页
湖大在职研究生信息检索考试资料.docx_第5页
第5页 / 共55页
湖大在职研究生信息检索考试资料.docx_第6页
第6页 / 共55页
湖大在职研究生信息检索考试资料.docx_第7页
第7页 / 共55页
湖大在职研究生信息检索考试资料.docx_第8页
第8页 / 共55页
湖大在职研究生信息检索考试资料.docx_第9页
第9页 / 共55页
湖大在职研究生信息检索考试资料.docx_第10页
第10页 / 共55页
湖大在职研究生信息检索考试资料.docx_第11页
第11页 / 共55页
湖大在职研究生信息检索考试资料.docx_第12页
第12页 / 共55页
湖大在职研究生信息检索考试资料.docx_第13页
第13页 / 共55页
湖大在职研究生信息检索考试资料.docx_第14页
第14页 / 共55页
湖大在职研究生信息检索考试资料.docx_第15页
第15页 / 共55页
湖大在职研究生信息检索考试资料.docx_第16页
第16页 / 共55页
湖大在职研究生信息检索考试资料.docx_第17页
第17页 / 共55页
湖大在职研究生信息检索考试资料.docx_第18页
第18页 / 共55页
湖大在职研究生信息检索考试资料.docx_第19页
第19页 / 共55页
湖大在职研究生信息检索考试资料.docx_第20页
第20页 / 共55页
亲,该文档总共55页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

湖大在职研究生信息检索考试资料.docx

《湖大在职研究生信息检索考试资料.docx》由会员分享,可在线阅读,更多相关《湖大在职研究生信息检索考试资料.docx(55页珍藏版)》请在冰点文库上搜索。

湖大在职研究生信息检索考试资料.docx

湖大在职研究生信息检索考试资料

一.基本概念

1.文献:

定义:

文献是记录有知识或信息的一切载体。

具体地说文献是以文字、符号、图形、声频、视频等手段将信息、知识记录在各种载体上所形成的物质实体。

即记录有信息、知识的纸张、胶片、磁带、磁盘、光盘及一些网络资源都可以称之为文献。

文献的主要功能是存储信息、传递信息。

文献的特征:

包括文献的内容特征和文献的外表特征两个方面。

2.信息:

定义:

信息是事物运动的状态与方式的反映。

简言之,信息就是事物发出的消息。

人与人间传递信息可通过:

肢体语言、口头语言、书面语言等。

信息的特征:

①普遍性;②时效性;③客观性;④可加工性;⑤共享性;⑥可变换性;⑦传递性;⑧可转化性

3.知识:

关于知识的定义亦有种种,西方20世纪60年代以来一直流行的说法是经济合作与发展组织(OECD)在《以知识为基础的经济》专题报告中所提的知识定义:

“4个W”:

●Knowwhat(知道是什么)——关于事实方面的知识。

●Knowwhy(知道为什么)——关于自然原理和规律方面的知识。

●Knowhow(知道怎么做)——关于技能或能力方面的知识。

●Knowwho(知道谁有知识)——关于到哪里寻求知识的知识。

定义:

知识是人类认识的成果和结晶,是人类在认识和改造世界的社会实践中获得的对事物本质的认识和经验的总和。

这是广义的知识概念。

知识具有主观性、抽象性、客观性的特点。

4.情报是指传递着的有特定效用的知识。

情报是对信息进行有目的加工组织的产物,蕴涵于信息之中,是对信息进行有针对性的提炼、重组的结果。

二.文献的基本类型与特征

对文献类型的划分,由于所选标准以及分析方法不同,有各种不同的划分方法,一般可按下面几种情况来划分。

1按照文献的出版形式划分

图书

定义:

图书:

是指具有独立的内容体系、相当篇幅和完整装帧形式的文献。

图书往往是以原始记录为素材,对某—领域进行系统阐述,或对现有研究成果、技术和经验进行归纳、概括而成,多为总结性。

特点:

内容比较成熟、全面、系统、可靠且具有一定的新颖性。

不足之处:

出版周期长,传递信息速度慢。

通过它可以全面、系统地了解一个学科或专门领域的研究历史与现状,在调查显示的科研人员利用文献的比重中,图书只占15%左右。

从信息检索的角度看,图书不构成主要对象。

科研人员一般不把它列为首选的使用对象

连续出版物

(1)期刊:

定义:

又称杂志,是定期或不定期连续出版的、有统一的名称、固定的开本、版式、有连续的序号、汇集了多位作者分别撰写的多篇文章,并由专门的机构编辑出版的连续性出版物。

期刊的种类很多,有学术性刊物,普通的快报、消息性刊物,数据性刊物、检索刊物亦以期刊的形式出版。

较图书更新迅速、反映研究动态与前沿。

目前,全世界每年出版的各类期刊中,科技期刊约占2/3。

我国现有的期刊中,科技期刊占54%以上。

据统计,科研人员从期刊中得到的信息约占65%以上,是十分重要的情报源。

特点:

内容新颖、信息量大、出版周期短、传递信息快、传播面广、时效性强

用途:

获取最新研究成果和动态

核心期刊:

某学科(或某领域)的核心期刊,是指那些发表该学科(或该领域)论文较多、使用率(含被引率、摘转率和流通率)较高、学术影响较大的期刊。

(2)报纸:

有统一的名称,定期连续出版,每期汇集许多篇新闻、报道、消息、评论等,多为对开或四开,以单张散页形式出版。

以传播新闻和评论、提供娱乐或生活服务为主要内容。

具有时事性、普及性、大众性、服务性和传递信息迅速、信息量大的特点,是一种十分重要的信息来源,有人称之为“第一传媒”。

报道快、及时、新颖、发行量大,是图书、期刊等无法比拟的。

特种文献

通常指那些出版发行方式或获取途径比较特殊的文献,非书非刊,形式多样。

(1)科技报告:

也称技术报告、研究报告,是科学研究工作和开发调查工作成果的记录或正式报告。

按研究阶段可分为进展报告和最终报告。

特点:

信息新颖、叙述详尽、保密性强、每份报告单独成册、有独立的编号、有固定的机构名称和较严格的陈述形式,是获取最新信息的重要信息来源。

科技报告内容新颖、专业性强,技术数据具体详尽,完整可靠,信息含量高,有数据、图表、实验记录等相关资料,涉及领域十分广泛。

对于了解某项技术的研制试验和评价结果,某项科学技术问题的现状和发展,非常重要。

科技报告的数量很大,在全世界的科技报告中,美国占了80%以上。

如:

美国政府四大报告:

PB、AD、NASA、DOE报告,都有各自的检索工具。

(2)会议文献:

是了解有关领域发展情况的重要资源,有会前文献、会中文献、会后文献之分(会议论文等:

正式出版物)。

(3)专利文献:

专利制度的产物,是实行专利制度的国家,在接受申请和审批发明过程中形成的有关出版物的总称。

包括专利说明书、专利公报、专利分类表、专利检索工具以及与相关的法律性文件。

目前全世界有130多个国家建立了专利制度,我国的专利法是1984年3月通过,1985年4月开始实施的,它的目的在于通过保护发明人的合法权益推动技术的发展。

目前专利制度已进入国际合作阶段。

各个国家的专利审批机构、国际性专利组织都是获取专利文献的重要来源(另:

专利网站、数据库)。

(4)技术标准:

标准化的产物,是经过公认的权威机构(标准化组织或有关机构)以特定的文件形式出现的标准化工作成果。

由技术标准、管理标准及其他具有标准化性质的类似文件所组成,是从事生产和建设的一个共同依据。

特点:

具有权威性、规范性、法律性、时效性、陈旧性。

目前,各个领域都在标准化的影响范围之内。

技术标准按内容可分为基本标准、产品标准、方法标准、安全卫生标准。

(5)学位论文:

是指高等学校或研究机构的学生为取得某种(博士、硕士及学士)学位时,在导师的指导下撰写并呈交的体现其学术研究水平,并供审查答辩用的研究论文。

特点:

具有一定的独创性;一般不公开出版;质量参差不齐。

(6)政府出版物:

各国政府及其设立的专门机构所颁发行政文件和科技文献的总称。

就其性质可分为行政性文献和科技性文献两大类。

行政性文献包括国企记录、政府法令、方针政策、规章制度、决议指示、调查报告、统计资料等;科技性文献包括科技研究报告、科普材料、技术政策文件等。

政府出版物具有正式性、权威性的特点。

(7)技术档案:

是指科研生产活动中形成的,有具体事物对象的技术文件、图纸、图表、照片和原始记录等的总称。

(8)产品样本:

产品样本是对定型产品的性能、构造原理、用途、使用方法和操作规程等所作的具体说明。

3按加工的深度划分:

零次文献信息:

(non-printedDocument)

指未经出版发行的或未进入社会交流的最原始的文献。

如:

私人笔记、底稿、书稿、手稿、实验记录、会议记录、个人通讯等。

具有内容新颖、不成熟不定型不公开交流、难以获得的特点。

零次文献在内容上有一定的价值,而且能弥补一般公开文献从信息的客观形成到公开传播之间费时甚多的弊病,其新颖程度颇受关注。

一次文献信息:

(PrimaryDocument)

又称原始文献,通常是指著者以自己的研究成果为基础创作或撰写的,已公开发行进入社会流通使用的文献,如:

专著、学术论文、专利说明、科技报告等。

具有新颖性、创造性的特点,是科技人员参考得最多的基本材料,有很高的直接参考价值和借鉴使用价值,但数量庞大,储存分散,不易直接查找利用。

二次文献信息:

(SecondaryDocument)

二次文献的生成过程即是对知识信息有序化的二次加工过程。

是把大量的、分散的、无序的文献收集进来,按照一定的方法进行加工、整理、提炼、浓缩,使之系统化,便于查找而形成的文献。

如文摘、题录、书目、索引等检索工具。

在现代社会信息量激增的形势下,人们为了快速而经济地传递信息、搜集和利用信息,更加关心和重视使用文摘杂志,具有浓缩性、汇集性、有序性的特点。

三次文献信息:

(TertiaryDocument)

是选用大量有关的文献,经过综合、分析、研究而编写出来的文献。

通常是围绕着某个专题,在利用二次文献的基础上,选用大量相关的一次文献,采用科学的方法,对文献的内容进行深度加工、编写而成的。

如综述、述评、字典、词典、辞典、百科全书、类书、政书、手册、年鉴、指南等。

现代技术的发展,使文献的这种划分界线变得模糊,大部分数据库集文献线索检索与原文献获取为一体。

四者的相互关系

从零次文献、一次文献、二次文献到三次文献,它是一个由分散到集中,由无序到有序,由博而略地对知识信息进行不同层次的加工过程。

零次和一次文献是最基本的信息源,是文献信息检索和利用的主要对象;二次文献是一次文献的集中提炼和有序化,是文献信息检索的工具;三次文献是把分散的零次、一次、二次文献按照专题或者知识的门类进行综合分析加工而成的成果,是高度浓缩的文献信息,它既是文献信息检索和利用的对象,也可作为检索文献信息的工具。

它主要有两大类型:

一是系统阐述某个领域的内容、意义、历史、现状和发展趋势的综述性学科总结,如综述、评论、述评、进展、动态、教材等;二是把大量的定理、原理、数据、公式、方法等知识进行浓缩和概括,编写成便于查阅的参考工具书,如百科全书、手册、年鉴、指南等。

三次文献内容更集中,针对性更强,系统性好,并有一定的检索功能,有较高的参考价值。

4根据出版形式和内容公开程度划分

白色文献白色文献是指一切正式出版并在社会成员中公开流通的文献,包括图书、报纸、期刊等。

这类文献多通过出版社、书店、邮局等正规渠道发行,向社会所有成员公开,其蕴涵的信息大白于天下,人人均可利用。

是当今社会利用率最高的文献。

灰色文献灰色文献指非公开发行的内部文献或限制流通的文献。

因从正规渠道难以获得,故又被称为“非常见文献”或“特种文献”。

这类文献出版量小,发行渠道复杂,流通范围有一定限制,不易收集。

其收录和获取成本较高,但是价值却很大。

黑色文献包括两方面的情况:

其一,人们未破译或未识别其中信息的文献,如考古出现的古老文字、未经分析厘定的文献;其二,处于保密状态或不愿公布其内容的文献,如未解密的档案、个人日记、私人信件等。

这类文献除作者及特定人员外,一般社会成员极难获得和利用。

三、文献信息检索基础知识

1信息检索的相关概念:

信息检索:

即信息查找,是人们利用特定的检索技巧与方法,从信息集合中对目标资源进行快速定位、获取与信息需求相关的那部分信息的过程。

也就是:

将信息按照一定的方式组织和存储起来,并根据用户的需求找出有关信息的过程。

有广义,狭义之分。

完整的信息检索概念包括两项工作:

(1)信息存储过程,即搜集、筛选、整理、积累现有信息及检索工具,建立信息检索系统;

(2)信息检索过程,即利用信息检索工具查找所需要的信息。

狭义的信息检索即利用信息检索工具查找所需要的信息。

则仅指该过程的后半部分,即从信息集合中找出所需要的信息的过程,相当于人们通常所说的信息查询。

2文献信息检索的类型

根据检索方式(即依赖的检索工具与检索系统)来划分:

手工检索是利用检索工具与工具书进行的,在检索之前,要对检索工具的编排、检索方法,包含的内容进行全面了解。

计算机检索是利用数据库或检索系统进行的,输入指令由计算机自动匹配完成。

因此拟定的检索式应该便于系统识别。

3文献信息检索系统

3.1检索系统的概念

信息检索系统:

又称情报检索系统,是指按某种方式、方法建立起来的,以提供信息检索为目的一种有层次的信息存储与检索系统,是表征有序的信息特征的集合体。

其中二次或三次文献信息是文献信息系统的核心和概括。

信息检索系统的建立是以对所收录信息的组织为基础的,是一定范围文献、信息的全部记录的有序集合。

功能:

报道文献信息、存储文献信息、检索文献信息

四.文献信息检索语言

1检索语言的概述

定义:

检索语言(informationretrievallanguage)是信息存储与检索过程中用于描述信息特征和表达用户信息提问的一种专门语言。

也称标引语言、索引语言、信息检索语言。

检索语言独立于具体的检索工具或检索系统之外,作为一种软件被若干检索工具或检索系统所利用。

2检索语言的主要类型

按检索语言的结构与产生原理分:

分类语言、主题语言、代码语言。

1.分类语言

⑴相关概念:

①分类语言:

按知识门类的逻辑次序对信息进行组织与检索的语言,是从文献内容的学科属性对文献进行描述与揭示,建立在对文献、信息所属内容的特征基础上的检索语言。

按分类语言对检索系统进行组织,具有按学科组织与检索相关文献信息的作用,这就是分类语言的族性检索(从学科门类)功能。

具有极好的扩检与微检功能。

②类目:

是分类语言的基本语汇。

一个特定类目由分类号与类目名称共同构成。

分类号的主要功能是组织文献与提供检索。

分类号的标记制度:

纯数字(《科图法》)、字母与数字共同组成的混合制(《中图法》)两种。

类目名称是用来说明特定类目所聚集的文献、信息的学科范围的一组文字。

如“I247中国现代长篇小说”(《中国图书馆分类法》)中的“I247”为分类号,“当代作品(1949-)”为类目名称。

⑵分类语言的最大特色是它的族性检索功能,使用它比较容易进行扩检与缩检。

但这种检索语言的局限亦十分明显,即同一主题的文献、信息常常被分散到不同的类目之下。

⑶中国图书馆分类法(《中图法》)

中国图书馆分类法《中图法》是国家标准。

共分五个基本部类:

马列主义、毛泽东思想;哲学;社会科学;自然科学和综合性图书。

在五大部类的基础上,社会科学展开为九大类,自然科学展开为十大类,共计22个基本大类,称为一级类目,每个基本大类下又可划分成若干个二级类目,二级类目下再划分出若干个三级类目,这样屡屡划分,逐级展开,类目可细分至七级。

由于T类“工业技术”是一个庞大的体系,文献数量巨大,因此又以双字母标记展开了16个二级类,其重要程度不亚于基本大类。

2.主题语言

⑴定义:

主题语言是表达文献内容中所涉及的核心事物与概念的检索语言。

主题法:

用以自然语言中的词语或规范化的词语作为揭示文献主题的标识,并以此标识编排组织和查找文献的方法

主题词:

指代特定概念与事物的语词。

主题词有自然语言中的词语,也有从自然语言中优选出的规范化词语。

⑵主题语言的类型

主题法在发展过程中,依选词的不同,先后出现了标题词法、单元词法、关键词法和叙词法等多种文献组织与检索的方法。

关键词法:

关键词是指那些出现在文献标题(篇名、章节名)、摘要和正文中,对表征文献主题内容具有实质意义的词语。

关键词语言是直接选用文献中的自然语言作为基本词汇,并将那些能够揭示文献主题的关键性词汇作为关键词进行标引和检索的一种检索语言。

关键词是非规范的,无需查阅标准词表,不受词表控制,快捷简便,适于用计算机组织和检索文献信息。

但由于关键词法的词语不规范,影响了文献信息的查全率和查准率。

如果你所使用的关键词不规范,随意性太强,就可能查不出相应的文献。

分类语言、叙词语言和关键词语言是目前检索系统所使用的通用检索语言,是我们认识和使用一种检索工具与检索系统的起点。

目前大多数搜索引掣使用的都是关键词语言,而学科信息门户使用的基本是规范语言。

五.文献信息检索途径

1以文献信息外表特征为检索途径:

题名途径:

是以各种事物的名称为检索点来检索文献信息。

主要用于检索图书,期刊与有关资料。

著者途径:

以文献著者的姓名字顺为检索点进行检索的一种途径。

这类检索工具有著者目录、著者索引,机构索引等。

号码途径:

是以文献信息的号码标识为检索点来检索文献信息的途径。

在已知文献代码情况下,利用代码途径检索文献,可谓是一条既快又准的捷径。

2以文献信息内容特征为检索途径:

关键词途径

是以文章作者所列出的、反映自己文章主题内容的关键词作为检索点来检索文献。

这是机检中使用频率很高的一种检索途径。

分类途径

是以文献信息内容所属的学科类别为检索点来检索文献的一条途径。

它是检索文献的主要途径之一。

常用的工具有分类目录和分类索引。

主题途径

这是以反映文献内容的有关主题词作为检索点检索文献的一条途径,它也是文献检索的主要途径之一。

按主题途径检索的关键是选准主题词,合理选择和使用主题词,对检索结果的优劣直接产生影响。

主题检索途径是目前很受用户欢迎的一种文献信息检索途径。

引文途径

利用被引文献来查找原文献的检索方法。

如:

CNKI中国期刊网被引用字段,维普中文期刊数据库引文检索途径。

中文社会科学引文索引

1.5.3计算机信息检索的基本技术与方法

[学习重点]熟练掌握计算机信息检索的基本技术

1.5.3.1计算机文献信息检索的技术

查全率(Recallratio)=[检出相关文献量/文献库内相关文献的总量]×100%

查准率(Precisionratio)=[检出相关文献量/检出文献总量]×100%

1.布尔逻辑检索(逻辑组配检索)(Booleanlogical)

指采用布尔逻辑表达式来表达用户的检索要求,并通过一定的算法和实现手段进行检索的过程。

布尔逻辑表达式是采用布尔运算符(逻辑与“and”、逻辑或“or”、逻辑非“not”等)来连接运算检索词,以及表示运算优先级的括号组成的一种表达检索要求的一种算式,简称提问逻辑式。

●逻辑与“AND”运算符,也可用“*”表示,用来组配不同的概念的检索词。

是一种概念相交和限定关系的组配。

例如:

“AANDB”或“A*B”

其含义是:

检出的信息中必须同时含有“A”和“B”两个检索词。

基本作用是对检索范围加以限定,逐步缩小检索范围,提高检索结果的查准率。

例如,检索“计算机在图书馆中的应用”方面的文献,其提问式可写成:

计算机and图书馆或计算机*图书馆

●逻辑或“OR”运算符,也可用“+”表示,是用来组配具有同义或同族概念的检索词。

如:

检索提问式:

“AORB”或“A+B”

其含义是数据库记录中任何一条记录,只要含有“A”或“B”中任何一个检索词即为命中的文献。

基本作用是扩大检索范围,增加命中文献量,提高文献的查全率。

如:

“微机+电脑+PC机”、“微机or电脑orPC机”

●逻辑非“NOT”运算符,也可用“-”表示,“NOT”算符是排除含有某些词的记录,其逻辑提问表达式为“ANOTB”或“A-B”,即检出的记录中只能含有“NOT”算符前的检索词A,但不能同时含有“NOT”后的检索词B。

基本作用是缩小检索范围,但并不一定能逻辑非提高文献命中的准确性,一般只起到减少文献输出量的作用。

在联机检索中可降低检索费用。

例如:

“计算机NOT微机”

应注意,由于“NOT”算符有排除掉相关文献的可能,因此,在实际检索中应慎重使用。

2.截词检索

截词检索是在词干的不同位置添加截词符“?

”、“*”或“$”,以此代表词的可变部位,以检索一组概念相关或同一词根的词,从而减少相同词干的检索词的输入数量,提高检全率的一种常用检索方法。

这种检索方式可以扩大检索范围,提高查全率,主要用于西文数据库检索。

中文数据库通常不使用这种技术。

主要用于检索词的单复数、词性的词尾变化、词根相同的一类词,以及同一词的拼法变异等。

在不同的检索系统里用不同的符号,一般为:

*、?

、!

基本作用是提高查全率,防止漏检。

类型:

■根据截词的位置不同,分为前截断、后截断、中截断

•前截断:

又称左截断,截词符放在被截词的左边,可与后截断一同使用。

目前这种检索技术应用已经极少,例如:

*magnetic。

•中截词:

把截词符放在词的中间。

这种方式查找英美不同拼法的概念最有效。

例如:

如:

wom*n可检出woman,women

•后截断:

是前方一致检索,又称右截断,截词符放在被截词的右边,是最常用的检索技术,例如:

librar*。

■根据截断的数量不同,分为有限截断和无限截断。

•有限截断:

限制被截断的字符数量,例如输入apple?

?

表示被截断的字符只有两个,可检出apple、applet等结果。

•无限截断:

不限制被截断的字符数量。

例如输入educat!

,可以检索educator,educators,educated,educating,education,educational,等等。

•注:

不同的数据库所用的截词符不一样,使用应先查一下各数据库的帮助加以确认。

3.位置算符检索

表示两个检索词间的位置临近关系,又叫邻接检索。

这种检索技术通常只出现在西文数据库中,在全文检索中应用较多。

布尔逻辑运算符表示两个概念之间的逻辑关系,位置算符表示的是两个概念在信息中的实际物理位置关系

常用位置算符

•W/n(with/n):

两词相邻,在一个标引字段中W/n表示两个词不可以互换顺序,二者之间可插入0-n个词。

如:

智能机器人(w/3)控制,可检出“智能机器人控制”,“智能机器人行为控制”等

•N/n(near/n):

两词相邻,N/n表示两个词可以互换顺序,二者之间可插入0-n个词。

如:

智能机器人(n/3)控制,可检出“智能机器人控制”,“控制算法对智能机器人的影响”等

•F(field):

同字段检索,被f连接的检索词必须出现在同一字段中。

•S(sub-field/sentence):

同句检索,要求参加检索运算的两个检索词必须在同一自然句中出现。

4.限制检索

通过设定相应的检索条件实现对检索的优化。

是缩小或约束检索结果的方法,最常用的是对特定字段的限定检索。

如:

riceinti(表示只在题目字段中查找文献)

riceinde(只在主题词中查找)

riceinab(只在文摘中查找)

au=Smith,J.C(查作者为Smith,J.C的文章)

py=1998(只查1998年的文章)

la=Chinese(只查语种为中文的文献)

常用的限制检索方式:

•字段检索——将检索限定在特定字段内进行限制的方法。

字段限制范围的大小顺序是:

题名<关键词<摘要<全文

常见的检索字段:

题名(Title,TI)、著者(Author,AU)、文摘(Abstract,AB)、关键词(Keyword,KW)、文献类型(DocumentType,DT)、主题词(DE)刊名(Journal,JN)、语种(Language,LA)、全文(Full-text)等

5.禁用词表

有些词在单独使用时无实际意义或出现频率过高,一些检索系统规定这些词为禁用词(StopWords),如:

in,on,about,a,an,only,do等。

这些词在某些数据库(如BPBIOSISPreviews生物学文摘数据库)中不能作为检索词。

6.嵌套检索技术

用括号将优先检索的检索式括起来,系统首先检索括号中的概念。

优先算符()优先级别最高

优先级运算:

()>NOT>AND>OR

7.全文检索:

全文检索是指对文献全文内容进行字符串匹配检索,包括字符串检索、截词检索和位置检索等技术。

全文检索技术是一种面向全文、提供全文的新型检索技术。

它可以使用原文中任何一个有实际意义的词作为检索入口,得到的结果是源文献而不是文献的线索。

全文检索系统必须具有一个全文数据库。

在全文库的基础上,对其字、词、句、段等的加工、检索与编辑。

系统除了可以用布尔逻辑运算式进行检索外,还具有文本检索功能,并具有同义词控制、后控词表对检索策略的自动调整等功能。

此外,系统还允许用户以自然语言进行检索,直接获取原文中的有关章、节、段、句等。

8.扩检:

在试探性检索所获取的检索结果过少,还不到检索要求时,应采取扩展检索以扩大检索范围,保证检索率。

采用的方法可以是增加检索词:

如将原检索词的所有同义词、别名、俗名作为检索词进行组配检索,使用截词技术或扩大检索的年代与文献范围。

缩检:

亦称二次

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 人文社科 > 法律资料

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2