文献检索与利用复习要点讲解.docx
《文献检索与利用复习要点讲解.docx》由会员分享,可在线阅读,更多相关《文献检索与利用复习要点讲解.docx(16页珍藏版)》请在冰点文库上搜索。
文献检索与利用复习要点讲解
文献检索与利用(R)复习要点
一、填空题涉及的知识(21-24是XX的)
1.文献(定义):
文献,记录有知识的一切载体
2.十大科技文献(图书、期刊、学位论文、会议文献、专利文献和标准等)
根据文献的知识内容和出版类型可将科技文献划为:
(1)科技图书
(2)科技期刊定义:
一种定期或不定期连续出版,并计划无限期出版下去,有固定的名称,每期具有统一的连续序号,以发表作者新作的出版物。
分类:
根据期刊内容和用途的不同,可分为——学术性Journal,Acta,Annales,Transactions,Reviews,Progress,Advances快报性Letters,Communications,Bulletin消息性News④资料性Data⑤检索性Abstracts
(3)科技报告
(4)专利文献
(5)会议文献
(6)标准文献
(7)学位论文
(8)产品样本,技术档案,政府出版物
3.信息检索、文献检索(定义)
(1)信息检索——从信息存贮系统中查找出特定信息的过程。
包括事实检索、数据检索和文献检索。
(2)文献检索——以文献(包括文摘、摘录或全文)为检索对象的信息检索。
从已存贮的文献库中查找出特定的文献的过程。
文献检索是相关性检索,即不直接解答用户所提出的技术本身问题。
4.分类语言及常见的图书分类法、主题语言
(1)分类语言Classfication(体系分类语言等)
主标题词语言SubjectHeading
题单元词语言Uniterm
语叙词语言Descriptor
言关键词语言Keyword
描述文献外部特征的检索语言:
提名﹑作者、号码等(在文献上清楚标明显而易见的特征与内容没有明显的关系,具有客观性、确定性、唯一性)
根据词语的组配方式分为:
组式检索语言、后组式检索语言
(2)图书分类法
它是以文献内容的学科性质为对象,运用概念概括与划分的方法,按照知识门类的逻辑次序从一般到具体、从简单到复杂层层划分,所形成的一种等级体系。
.《中国图书馆图书分类法》(中国法)
.《中国图书院图书分类法》(科图法)
.《DeweyDecimalClassificationSystem》(杜威十进分类法)
.《LibraryofCongressCalssification》(美国国会图书馆图书分类法)
.《UniversalDecimalCalssification》(国际十进分类法)
(3)主题语言
.表达主题概念、反应文献内容特征的词语就叫做主题词
.主题词可分为:
标题词、单元词、叙词、关键词。
.叙词
叙词特点:
从名词中抽取出来的术语;经过规范化处理;词语词之间有严格的语义关系;具有组配性能(概念组配)。
5.检索工具(填空简答都要考)
(1)检索工具
定义:
以压缩形式存贮、报道和查找信息(文献)的工具
要素:
文献记录、文献标识、检索手段
功能:
报道、存储和检索
特点:
.
(1)详细而完整地记录所著文献的线索。
.
(2)对所著文献都标有可供检索的各种标识。
如分类号、主题词、著者姓名、文献序号。
.(3)提供多种检索途径。
满足用户多角度查找文献
.(4)必须跟着标识的顺序,系统地、科学地排列文献,使其成为一个有机的整体。
(2)检索工具种类(填空)
按检索方式分为:
手工检索工具机检系统
按检索对象分为:
实时数据检索工具文献检索工具
按收录学科范围分:
综合性、专业性、专题性
按文献类型来源分:
全面性、单一性
6.检索方法和原文获取
检索方法:
(1)常规法:
所谓常规法就是利用常规检索工具查找有关文献的方法顺查法、倒查法、抽查法
(2)引文法:
就是查找参考文献或引用文献的方法。
由远及近地搜寻;由远及近地追溯
(3)综合法:
引文法和常规法结合
原文获取:
直接获取、间接获取、求助
7.检索效果(查全率、查准率)
.检索效果(retrievaleffectiveness)指检索系统的有效程序,反应检索系统的能力。
主要对机检提出,有些指标对手检也有意义。
.有6个评价指标:
收录范围、查全率、查准率、响应时间、用户负担、输出形式
.我们主要掌握查全率R和查准率P
.a---检索出的相关文献量
.b---误检的文献量
.c---漏检的文献量
相关文献
无关文献
总计
检出文献
A
B
A+B
未检出文献
C
D
C+D
总计
A+C
B+D
A+B+C+D
查全率:
R=A/(A+C)*100%
查准率:
P=A/(A+B)*100%
提高措施:
工具质量,检索技能,指标调节
8.数据库类型
全文数据库、书目型数据库、词典型数据库、事实型数据库、多媒体数据库
9.记录、字段
(1)记录(records)
记录是文档的基本单元。
它是对某一实体的全部属性进行描述的结果。
在全文数据库中,一个记录相当于一篇完整的文献;在书目数据库中,一个记录相当于一条文摘或题录。
(2)字段(fields)
字段是记录的基本单元。
它是对实体的具体属性进行描述的结果,即记录中的每个著录项目,在书目数据库中,常见字段有:
TI(题名)、DE(叙词)、SU(主题词)、AB(文摘)、AU(著者)、AD(著者地址)、YR(年份)、LA(语言)
字段根据其描述文献特征的不同,可以分为两类:
基本索引字段:
这些是描述文献内容特征的字段,如篇名、文摘、叙词、自由标引词等字段。
辅助索引字段:
这些字段描述的是文献的外表特征,如著者、机构名称、语种、刊名、来源、出版年等。
10.逻辑运算符
(1)逻辑“与”
这种组配关系用“AND”或“*”表示,它用于检索概念之间的相交关系运算。
表示为AANDB或A*B
(2)逻辑“或”
用“or”或“+”连接检索概念。
可用其组配表达相同概念的检索词,如同义词、相关词等。
表示为AorB或A+B
(3)逻辑“非”
用“not”或“—”连接检索概念。
它用于在某一记录集合中排除含有某一概念的记录。
表示为AnotB或A-B
在以上的逻辑算符中,其运算优先级顺序为NOT、AND、OR,不过可以用括号改变它们的运算顺序,应注意对于同一个布尔逻辑提问式来说,不同的运算顺序会有不同的结果。
11.字段限定
限定字段检索即是指定检索词在记录中某一具体的字段中出现。
字段限定检索可以分为两类:
后缀方式(suffix)和前缀方式(prefix)
(1)后缀方式(EiVillage2系统)
对基本索引字段,如:
篇名(TI)、文摘(AB)、叙词(DE)、及某些辅助索引字段,如:
作者(AU)、作者地址(AD)进行字段限定时,将检索词放在字段代码之前,之前用字段限定符号:
WN
(2)前缀方式
对某些辅助索引字段,如:
语种(LA)、出版年代(PY)、进行限定时,将检索词放在所限定的字段代码之后,之间用字段限定符号:
=、<=、>=、<、>等。
12.国际联机检索
所谓联机检索(onlineretrieval)是指用户利用计算机终端设备,通过通信线路(网络),从信息中心的计算机数据库中检出所需要的信息的过程。
1962年,美国麻省理工学院进行了世界上最早的联机情报检索实验,研制成相容性分时系统CTSSII,用7094Ⅱ大型机,联接112个终端,实现了计算机与通信的结合。
20世纪70年代,联机检索在全世界得到了广泛应用。
七十年卫星通信的应用使联机检索进入国际联机检索阶段。
13.专利制度
专利制度:
专利制度是国际上通行的一种利用法律和经济的手段推动技术进步的管理制度。
其基本内容是依据专利法,对申请专利的发明,经过审查和批准,授予专利权。
发明人就在法律规定的有效期限内,对其发明创造享有制造、使用和销售的独占权,以此作为公开其技术的交换条件,同时又把申请专利的发明内容公诸于世,以便进行技术情报交流和技术有偿转让。
其作用是国家利用法律手段保护发明权益、鼓励发明的技术公开、促进竞争、激发人们的创造精神、打破技术封锁、促进新技术成果的推广应用。
其特征是法律保护、科学审查、公开通报。
14.知识产权
知识产权又叫智力成果权,是指智力劳动者对其创造性的智力劳动依法所享有的专有权利。
知识产权分为两部分,即“著作权”和“工业产权”。
15.专利
专利是指一个国家授予创造发明人在一定时间内对该发明创造的独占实施权,包括专利产品的生产、使用和销售,专利通常包括三个涵义:
专利权、获得专利权的发明创造、专利文献
16.发明、实用新型、外观设计三种专利(填空简答都要考)
1.发明专利。
是指对产品、方法或其他改进所提出的新的技术方案。
发明专利可分为两大类:
(1)产品发明:
如机器,仪器,设备,用具等
(2)方法发明:
如制造方法,测量方法及特定用途的方法发明等。
日本叫特许。
2.实用新型专利。
是指对产品的形状、构造或其结合所提出的适于实用的新技术方案。
日本叫实用方案。
注:
发明专利即保护产品发明,也保护方法发明,而实用新型专利只保护具备一定形状的物品发明。
方法发明及没有一定形状的液体,粉末,材料等类产品发明不属于实用新型专利的保护范围。
3.外观设计专利。
是指对产品的形状、图案或者其结合以及色彩与形状、图案的结合所作出的富有美感并适于工业应用的新设计。
17.新颖性、创造性、实用性
1.新颖性,是指在申请日以前没有同样的发明或者实用新型在国内外出版物上公开发表过、在国内公开使用过或者以其他方式为公众所知,也没有同样的发明或者实用新型由他人向专利局提出过申请并且记载在申请日以后(含申请日)公布的专利申请文件中。
2.创造性,是指专利申请同申请提交日前的现有技术相比,该发明具有突出的实质性特点和显著的进步。
该实用新型有实质性特点和进步。
所谓"实质性特点"是指与现有技术相比,有本质上的差异,有质的飞跃和突破,而且申请的这种技术上的变化和突破,对本领域的普通技术人员来说并非是显而易见的。
所谓"同现有技术相比有进步"是指该发明或实用新型比现有技术有技术优点或有明显的技术优点。
3.实用性,是指申请专利的发明创造,能够在工农业及其他行业的生产中批量制造或能够在产业上或生活中应用,并能产生积极的效果。
专利法规定:
授予专利权的夕卜观设计应当同申请日以前在国内外出版物上公开发表过或者国内公开使用过的外观设计不相同并且不相近似。
"不相同"是授予专利权的夕卜观设计应当具备新颖性。
它既不能同现有的同类产品的外观设计雷同,更不能是对它们的仿制、抄袭。
"不相近似"是授予专利权的外观设计应当具有独创性。
它既不能是对现有同类产品外观设计的简单模仿,也不能与它们只有本领域技术人员才能看得出的微小的差别,而应有公众一眼就能看出的明显的不同和变化里的"出版物"和"公开使用"同发明、实用新型中有同样的含义。
18.巴黎公约(包括优先权、强制许可等原则)
巴黎公约是保护工业产权方面影响最大的国际公约,它于1883年3月30日在巴黎签订,我国于1985年3月19日正式成为该公约成员国。
巴黎公约共有三十条,其中与专利国际保护有关的规定包括:
国民待遇原则;优先权原则;各国专利权独立原则;强制许可原则。
19.国际专利(同族专利)
20.国际专利分类法
21.Hill规则
22.CAS登记号
CAS号(CASRegistryNumber或称CASNumber,CASRn,CAS#),又称CAS登录号,是某种物质(化合物、高分子材料、生物序列(Biologicalsequences)、混合物或合金)的唯一的数字识别号码。
美国化学文摘服务社--为化学物质制订的登记号
23.网络搜索引擎
互联网搜索引擎是万维网中的特殊站点,专门用来帮助人们查找存储在其他站点上的信息。
搜索引擎有能力告诉你文件或文档存储在何处。
24.远程接入
远程接入即将普通用户接入Internet的相关技术,主要分为有线传输接入和无线传输接入两种。
远程接入技术允许家庭用户、移动用户和远程办公用户访问一个公司网络或在ISP情况下的因特网上的资源。
远程接入方法应该允许远程用户就像直接连接到网络上一样并使用相同的协议访问某个网络。
二、简答题涉及的知识
1.一次文献、二次文献、三次文献
答:
根据内容、性质和加工深度的不同,科技文献可分为:
(1)一次文献/信息(primaryliterature/info)
概念:
也称为原始文献,凡是文献作者根据自己的研究成果、发明创造、工作经验和实践体会为原始依据,撰写的第一次报道的或第一次出版的那些文献,如期刊论文、科技报告、会议论文、专利说明书等,一次文献就是以科研生产活动的第一手成果为依据而创作的文献(判断是否为一次文献),内容丰富,参考价值大,是文献的主体、文献检索的对象。
特点:
创造性、原始性、分散性
如:
PaperSci-TechreportProceedingsPatentspecificationDissertation...
(2)二次文献/信息(secondaryliterature/info)
概念:
将大量的分散的、无序的一次文献按照一定的规则进行加工、提炼和浓缩,组织成为系统的便于查找的文献。
二次文献是图书情报工作者在大量收集原始文献的基础上,经过分析、归纳、重组后出版的。
二次文献是一次文献的集约化、有序化的再次出版,是贮藏、利用一次文献的主要的、科学的途径。
特点:
汇集性、浓缩性、工具性,系统性
条目entry,reference,citation,record
●目录catalog
●题录bibliography
●文摘abstract
●索引index
(3)三次文献/信息(tertiaryliterature/info)
概念:
选用大量有关的文献,经过综合、分析、研究而编写出来的文献。
他通常是围绕某个特定的课题,利用二次文献,搜索大量的有关文献,采用科学的方法,对文献内容进行深度的加工,经综合、分析和评述编写而成再度出版的文献,如各种述评、进展报告、动态综述、手册、年鉴和百科全书Referencebook等。
我们通常把这类文献称为“情报研究”的成果。
特点:
综合性、价值性、针对性
2.检索语言
答:
检索语言是指用于描述检索系统中信息的外部特征和内容特征及表达用户信息提问的一种专门的人工语言。
检索语言是用于各种检索工具的编制和使用并为检索系统提供统一的作为基准的用于信息交流的一种符号化或词语化的专门语言。
检索语言把文献的存储和检索联系起来使文献的标引者和检索者取得共同理解从而实现检索,检索语言是沟通文献存储和文献检索两个过程的重要桥梁。
3.信息检索及文献检索
答:
根据检索对象的形式进行划分:
(1)信息检索——从信息存贮系统中查找出特定信息的过程。
包括事实检索、数据检索和文献检索。
(2)文献检索——以文献(包括文摘、摘录或全文)为检索对象的信息检索。
从已存贮的文献库中查找出特定的文献的过程。
文献检索是相关性检索,即不直接解答用户所提出的技术本身问题。
(3)事实检索——凡是能直接回答情报提问的事实数据作为检索对象的,为确定性检索。
(4)数据检索——凡是能直接回答情报提问的科学数据为检索对象的,为确定性检索。
4.专利权
答:
一项发明创造经过政府专门机构依据专门的法律审查、批准,专利发明人或持有人对该项发明创造享有的一定期限的制造、使用或销售专利产品的独占权。
5.国际专利申请
6.常用算符及功能
1、布尔逻辑检索功能
(4)逻辑“与”
这种组配关系用“AND”或“*”表示,它用于检索概念之间的相交关系运算。
(5)逻辑“或”
用“or”或“+”连接检索概念。
可用其组配表达相同概念的检索词,如同义词、相关词等。
(6)逻辑
用“not”或“—”连接检索概念。
它用于在某一记录集合中排除含有某一概念的记录。
在以上的逻辑算符中,其运算优先级顺序为NOT、AND、OR,不过可以用括号改变它们的运算顺序,应注意对于同一个布尔逻辑提问式来说,不同的运算顺序会有不同的结果。
如:
有A、B、C、D四个检索词(其中A和B、C和D分别为同义概念,两大概念之间是相交的关系)检索提问可以分步进行:
第一步:
AORB(结果为S1)
第二步:
CORD(结果为S2)
第三步:
S1ANDS2
在实际检索中,通过使用优先处理算符“()”,三组检索提问也可以归并为一组,即一步完成:
输入(AORB)AND(CORD)
2、词间位置检索功能
位置算符用于规定检索词相互之间的邻近关系,包括在记录中的顺序的相对位置。
在不同的检索系统中,所采用的位置算符是不同的,功能也有差异。
(1)with限定前后所连接的检索词出现在同一字段中,如:
applewithgrow表示检索记录中同时包含apple和grow,并且出现在同一字段中。
(2)Near限定前后所连接的检索词出现在同一句子中,如:
appleneargrow表示检索记录中同时包含apple和grow,并且出现在同一句子中。
(3)NearN同near,而N是指相互间最多可插入N个单词,N为正整数。
3、截词检索功能
一般用“?
”和“*”表示截词符。
要注意在不同的系统中,使用的符号及其含义有所不同。
按截词的位置可分为前截词、后截词、中间截词:
(1)前截词将截词符放在词根的前边,后方一致,表示在词根前方有无限个或有限个字符变化。
(2)后截词将截词符放在词根的后边,前方一致,如:
grow,在该词根后加“*”即为grow*,系统将检索出含有grow、growth、growing等词的所有记录。
使用前方一致的截词方法时需注意:
避免检索词的词干截得过短,否则可能会检出大量不相关的文献。
(3)中间截词它是将截词符号置于检索词的中间,而词的前后方一致。
通常用于英、美不同拼写形式的词(英语单词)进行检索。
如:
colo?
r可检出的词为colour(英音)、color(美音)。
4、限定字段检索功能
限定字段检索即是指定检索词在记录中某一具体的字段中出现。
字段限定检索可以分为两类:
后缀方式(suffix)和前缀方式(prefix)
(3)后缀方式(EiVillage2系统)
对基本索引字段,如:
篇名(TI)、文摘(AB)、叙词(DE)、及某些辅助索引字段,如:
作者(AU)、作者地址(AD)进行字段限定时,将检索词放在字段代码之前,之前用字段限定符号:
WN
如:
apple?
WNTI即apple或apples在篇名中出现即为检中。
taiyuanuniv*oftechnologyWNAD即在地址这字段中出现太原理工大学的即被检中。
(4)前缀方式
对某些辅助索引字段,如:
语种(LA)、出版年代(PY)、进行限定时,将检索词放在所限定的字段代码之后,之间用字段限定符号:
=、<=、>=、<、>等。
如:
LA=Chinese即限定原文语种为中文。
PY>=1995即限定出版年份为1995及以后的文献。
7.影响因子
答:
期刊在某年的影响因子定义为:
该年引证该刊前2年论文的总次数与前2年该刊所发表的论文总数之比,计算公式为:
IF=
如:
《科学通报》1999年和1998年所发表的论文总数为1000篇;2000年上述1000篇论文被引总次数为900次,2000年《科学通报》的影响因子为900/1000=0.9
8.检索词选择原则
答:
(1)选择规范词。
选择检索词时,一般应优先选择主题词作基本检索词,但为了检索的专指性也选用自由词配合检索。
(2)尽量使用代码。
(3)注意选用国外惯用的技术术语。
(4)避免使用低频词或高频词。
检索时避免使用频率较低或专指性太高的词,一般不选用动词和形容词;不使用禁用词;尽量少用或不用不能表达课题实质的高频词。
必须使用时,应与能表达主要检索特征的词一起组配,或增加一些限制条件再用。
(5)同义词尽量选全。
检索时为保证查全率,同义词尽量选全。
同义词选择应主要考虑:
同一概念的几种表达方式;同一名词的单、复数、动词、动名词、过去分词形式等,词根相同时,可用截词符解决;要考虑上位概念词与下位概念词;化学物质用其名称也要用其元素符号;植物和动物名,其英文和拉丁名均要选用
三、上机检索实践题涉及的知识
1.中国知网(CNKI)、万方数据的(初级)检索、专业检索,多类型文献的检索
2.工程索引(Ei)快速检索、专业检索
3.超星图书(读秀)图书检索、读秀学术搜索
4.中国专利、国外专利检索
5.科学引文索引(SCI)基本检索、被引参考文献检索
6.化学文摘网络版(SciFinder)文献检索方式、物质检索方式
四、综合题
1.对CNKI知识搜索(或超星图书(读秀)、XX学术搜索、万方数据、维普资讯、清泽搜索等网络搜索引擎或多种文献搜索)的检索结果结合所学文献检索理论进行分析。
2.利用所学文献检索知识对所检索的文献会进行记录其主要信息(如编写参考文献)。