川大信息检索及利用复习资料整理Word格式.docx

上传人:b****1 文档编号:4205324 上传时间:2023-05-02 格式:DOCX 页数:21 大小:184.58KB
下载 相关 举报
川大信息检索及利用复习资料整理Word格式.docx_第1页
第1页 / 共21页
川大信息检索及利用复习资料整理Word格式.docx_第2页
第2页 / 共21页
川大信息检索及利用复习资料整理Word格式.docx_第3页
第3页 / 共21页
川大信息检索及利用复习资料整理Word格式.docx_第4页
第4页 / 共21页
川大信息检索及利用复习资料整理Word格式.docx_第5页
第5页 / 共21页
川大信息检索及利用复习资料整理Word格式.docx_第6页
第6页 / 共21页
川大信息检索及利用复习资料整理Word格式.docx_第7页
第7页 / 共21页
川大信息检索及利用复习资料整理Word格式.docx_第8页
第8页 / 共21页
川大信息检索及利用复习资料整理Word格式.docx_第9页
第9页 / 共21页
川大信息检索及利用复习资料整理Word格式.docx_第10页
第10页 / 共21页
川大信息检索及利用复习资料整理Word格式.docx_第11页
第11页 / 共21页
川大信息检索及利用复习资料整理Word格式.docx_第12页
第12页 / 共21页
川大信息检索及利用复习资料整理Word格式.docx_第13页
第13页 / 共21页
川大信息检索及利用复习资料整理Word格式.docx_第14页
第14页 / 共21页
川大信息检索及利用复习资料整理Word格式.docx_第15页
第15页 / 共21页
川大信息检索及利用复习资料整理Word格式.docx_第16页
第16页 / 共21页
川大信息检索及利用复习资料整理Word格式.docx_第17页
第17页 / 共21页
川大信息检索及利用复习资料整理Word格式.docx_第18页
第18页 / 共21页
川大信息检索及利用复习资料整理Word格式.docx_第19页
第19页 / 共21页
川大信息检索及利用复习资料整理Word格式.docx_第20页
第20页 / 共21页
亲,该文档总共21页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

川大信息检索及利用复习资料整理Word格式.docx

《川大信息检索及利用复习资料整理Word格式.docx》由会员分享,可在线阅读,更多相关《川大信息检索及利用复习资料整理Word格式.docx(21页珍藏版)》请在冰点文库上搜索。

川大信息检索及利用复习资料整理Word格式.docx

1.4信息检索语言

信息检索语言的概念

是人们在加工、储存及检索信息时所使用的标识符号。

信息检索语言的分类

自然语言受控语言

几种常用的分类语言

中图法(中国图书馆分类法);

杜威十进分类法DDC

1.6信息检索工具和检索系统

计算机信息检索的类型:

参考数据库;

源数据库/联机检索系统(如DIALOG);

光盘数据库系统;

网络信息检索系统

1.7信息检索效果及评价

查全率查准率漏检率误检率其他

第2章信息检索技术及其应用

1、布尔算符:

用来规定检索概念或检索词之间相互逻辑关系的算符。

逻辑“与”:

AND(或*);

逻辑“或”:

OR(或+);

逻辑“非”:

NOT(或–)

2位置算符/词位算符:

用于限定词与词之间的位置关系,以提高查准率。

当检索词为词组形式时,或两个检索词之间可能被其他词或标点符号隔开时,均应使用位置算符。

(1)W-With

①W是With的缩写,表示在此算符两侧的检索词必须按输入时的前后顺序排列,不能颠倒。

所连接的词之间除可以有一个空格、标点或连接号外不得夹有任何其他单词或字母。

例:

intelligent(W)robot?

②Wn(或nW)表示在此算符两侧的检索词必须按输入时的前后顺序排列,不能颠倒。

但允许在连接的两个词之间最多插入n个单元词。

intelligentw1robot*

(2)N-Near

①N是Near的缩写,表示此算符两侧的检索词必须紧密相连,所连接的词之间不允许插入任何其他单词或字母。

但词序可以颠倒。

intelligentNEARrobot*

②Nn(或nN)表示在两个检索词之间最多可插入n个单词,且两词的词序任意。

intelligentN1robot*

3、截词检索:

截词是指将检索词在适当的地方截断,截词检索是用截断词的一个局部进行的检索,凡是满足这个截词所有字符(串)的记录,系统都为命中。

截词检索在西文数据库中广泛使用。

是在词干后可能变化的位置加上截词符号。

检索词的单复数形式,同一词英、美不同拼法,词根相同的词都可用截词检索。

这样既可减少检索词的输入量,又可扩大查找范围,提高查全率。

①按截词位置分:

前截断、后截断、中截断;

②按截词的字符数量分:

非限制截断、限制截断。

注:

表示截词的截断符号,各检索系统有不同的规定,没有统一标准。

(1)后截断

后截断是在检索词词干后面加截词符,表示不限制或限制词尾可变化的字符数,即查找词干相同的所有词。

从检索性质上讲,后截断是前方一致检索。

①非限制截断:

是在检索词词干后面加一个截词符,表示不限制词尾可变化的字符位数,即查找词干相同的所有词。

即允许其后可带有任何字符且数量不限。

comput?

相当于查找compute、computing、computerized、computationally……

不宜将词截得过短,否则容易造成误检。

②限制截断:

是在检索词词干后面加若干个截词符,表示限制可变化的字符数。

fib?

?

相当于查找fiber或fibre……

(2)中截断(通配符或屏蔽)

是把截断符号置于一个检索词的中间,对词中间出现变化的字符数加以限定。

一般中截断仅允许有限截断。

organi#ation,可检索到包含organization和organisation的记录。

①一个?

,代表零个或任意个字符。

colo?

r可检索到包含color、colour、colonizer、colorimeter的记录。

②一个?

和数字,其中的数字代表可替换的字符数。

colo?

1r,只能检索到包含colour的记录。

4、字段检索:

指定检索词出现的字段,被指定的字段也称检索入口,检索时,系统只对指定字段进行匹配运算,提高了效率和查准率。

西文数据库,字段检索常用代码来表示,如:

作者AU,机构名称CS,文摘AB,题名TI,关键词KW。

四、学位论文数据库

1、学位论文是本科生和研究生从事学习和科学研究活动的学术论文。

(1)与一般论文的写作比较,质量要求更高,结构更为严谨。

(2)与期刊论文的检索比较,有以下特殊的检索字段(入口):

导师、第一导师、导师单位、论文级别、学科专业名称、学位授予单位等。

2、学位论文信息检索

(1)CNKI学位论文全文数据库

(2)中国博士学位论文全文数据库

(3)中国优秀硕士学位论文全文数据库

(4)万方学位论文全文数据库

(5)四川大学学位论文数据库

(6)CALIS高校学位论文文摘库

(7)PQDD(学位论文数据库)

ProQuest公司是世界上最早及最大的博硕士论文收藏和供应商

第9章信息资源的利用与论文写作

9.4学术论文写作

1、学术论文的特点:

求实性科学性创新性理论性

2、学术论文的基本格式与写作要求

①规则:

GB7713-87(国标《科学技术报告、学位论文和学术论文的编写格式);

GB7714-87(国标《文后参考文献著录规则》)

②基本格式:

题名;

作者姓名和单位;

摘要;

关键词;

引言;

正文;

结论;

致谢(学位论文必备);

英文题名、摘要及关键词;

参考文献。

3、学术论文三要素:

论点、论据和论证。

英文电子图书

§

KingBook(金图国际外文数字图书馆)远程镜像

KingBook(金图国际外文数字图书馆)

MyiLibrary电子书数据库

Encyclopæ

diaBritannica(大英百科全书、不列颠百科全书)

SpringerEbooks

MyiLibrary电子书数据库

学科覆盖范围:

工程技术、自然科学、生命科学、医药、社会科学、法律、教育、心理、哲学、政治学、文学、语言、音乐等。

Encyclopæ

diaBritannica

EncyclopaediaBritannica包括印刷版《不列颠百科全书》的73000余条条目,提供有关各种主题完整而准确的信息,包括短条目和长及书籍的长条目。

BritannicaConciseEncyclopaedia《不列颠百科全书》简明版,包括28000个短条目,可以迅速解答有关历史、艺术、科学等主题的问题。

TheWeb‘sBestSites大英精选网站。

超过166,000专家编辑群精选推荐网站。

TheWeb'

sBestSites大英精选网站.

Merriam-WebsterDictionary&

Thesaurus韦氏词典及英语同义词字典

JournalsandMagazinesEBOnline还包括对EBSCO和ProQuest这两个数据库的部分期刊和杂志的检索.

TheNewYorkTimes,BBCNews焦点新闻.

SpotlightArchive大英主题数据库

WorldAtlas世界地图

WorldDataAnalyst全球资料分析

GatewaytotheClassics经典文献

NotableQuotations名人格言

BritannicaBlog大英知识博客

AdvocacyforAnimals动物保护站

SpringerLink系统可访问2010-2012版权年Springer出版的近10500种英文电子书,学科涉及化学与材料、数学与统计学、资源环境与地球科学、计算机科学、生命科学、医学、物理学、经济学、商业与管理、心理学、人文社科、法律、教育学、哲学,其中包括LectureNotesinComputerScience(计算机科学讲义)、LectureNotesinMathematics(数学讲义)、LectureNotesinPhysics(物理学讲义)和LectureNotesinEarthScience(地球科学讲义)等著名丛书

英文数据库

Webofscience

EBSCO

Gale

OCLC基础组的13个数据库

Emerald管理学、工程学数据库

ScienceDirect(ElsevierSDOL)

SpringerLink

Wiley-BlackWelle-journals

JSTOR(JournalStorage)-CASHL电子资源

PAO(PeriodicalsArchiveOnline)-CASHL电子资源

ProQuestResearchLibrary(PRL)ProQuest学术图书馆期刊数据

SAGEJournalsOnline

PQDD--ProQuestDigitalDissertations(CALIS镜像)学位论文

WebofScience

WebofScience由五个数据库组成,内容包含来自数以千计的学术期刊、书籍、丛书、报告、会议及其他出版物的信息

ScienceCitationIndexExpanded(科学引文索引)(SCI-Expanded):

是针对科学期刊文献的多学科索引。

SocialSciencesCitationIndex(社会科学引文索引)(SSCI):

是针对社会科学期刊文献的多学科索引。

Arts&

HumanitiesCitationIndex(艺术及人文科学引文索引)(A&

HCI):

是艺术和人文期刊文献的多学科索引。

ConferenceProceedingsCitationIndex-Science(CPCI-S):

此数据库对应印刷版的《科技会议录索引》(IndextoScientific&

TechnicalProceedings,简称ISTP)。

ConferenceProceedingsCitationIndex-SocialSciences&

Humanities(CPCI-SSH):

此数据库对应印刷版的《社会与人文科学会议录索引》(IndextoSocialScience&

HumanitiesProceedings,简称ISSHP)。

11个字段的深入分析

按照作者分析:

了解某个研究的核心研究人员是谁;

按照丛书名称分析:

按照会议名称分析:

了解论文发表在那些会议录上;

按照国家/地区分析:

了解核心研究国是哪里;

按照文献类型分析:

了解该研究通常以什么途径发表;

按基金资助机构分析:

了解发表论文基金资助的情况;

按照机构分析:

了解有哪些机构在从事这项研究

按照语种分析:

了解该研究是以什么语种发表的;

按照出版年分析:

了解该研究的发展趋势;

按照来源出版物分析:

了解该研究通常发表在哪些期刊上;

按照学科分类分析:

了解该研究涉及了哪些研究领域

EBSCO是美国的一家私人公司

名称来源于“EltonB.StephensCompany”

创建于1943年,1963年开设图书馆服务办公室,1986年开始发展电子信息产品,1994年开始在Internet上提供在线服务。

是全球最早推出全文在线数据库检索系统的公司之一

可以提供100多种全文数据库和二次文献数据库。

所用检索系统为“EBSCOhost”。

Gale平台数据库

Gale集团隶属于全球最大的信息传媒集团之一TheThomsonCorporation(TTC),是国际著名出版机构和全球最大、最权威的参考书出版商,多年来在出版人文科学工具书以及机构名录方面颇具权威性。

图书馆购买了Gale集团6个专题数据库,内容来自Gale集团多年来出版的众多参考书系列,许多资料为Gale集团独家拥有,是重要的事实性数据来源。

数据每月更新一次。

OCLC基础组的12个数据库

JSTOR(JournalStorage)-CASHL电子资源

该库是以政治学、经济学、哲学、历史等人文社会学科主题为中心,兼有一般科学性主题共十几个领域的代表性学术期刊的全文库,从创刊号到最近两三年前过刊都可用影像来阅览全文,有些过刊其回溯年代早至1665年,目前共计400多种期刊,具体内容包括:

1.Arts&

SciencesICollection人文社会主题一

2.GeneralScienceCollection一般科学性主题

3.Ecology&

BotanyCollection生态学与植物学主题:

4.Arts&

SciencesIICollection人文社会主题二

5.BusinessCollection商业主题:

有关商业方面的期刊46种。

6.Language&

LiteratureCollection语言文学专题:

共47种刊。

PQDD学位论文全文库是目前国内唯一提供国外高质量学位论文全文的数据库,主要收录了来自欧美国家2,000余所知名大学的优秀博硕士论文,目前中国集团可以共享的论文已经达到254345篇,涉及文、理、工、农、医等多个领域,是学术研究中十分重要的信息资源。

CALIS公共目录检索系统(

一、信息、知识、文献的概念

1.信息(information):

信息是指客观事物相联系,反映客观事物的运动状态,通过一定的物质载体被发出、传递和感受,对接受对象的思维产生影响并用来指导接受对象的行为的一种描述。

从本质上说,信息是反映现实世界的运动。

发展和变化状态及规律的信号与消息。

2.知识:

知识是人类在改造客观世界实践中所得的认识和经验的总合,是信息的一部分,是一种特定的人类信息。

3.文献(document):

文献是用文字、图形、符号、声频、视频等技术手段记录人类知识的一切物质载体。

二、信息、知识和文献之间的相互关系

1.信息是事物的本来面貌,信息经过人脑加工形成知识。

2.只有将自然现象和社会现象的信息经过加工,上升为对自然和社会发展客观规律的认识,这种再生信息才构成知识。

3.知识信息被记录在载体上就形成文献。

文献必须包含知识内容,而知识内容只有记录在物质载体上才能构成文献。

文献经过传递、传播、应用于理论与实际而产生新的信息。

一、文献信息资源的层次

从对文献的生产加工与组织层次来看,文献可以分成一次文献、二次文献和三次文献。

1.一次文献(primarydocument)

即原始文献。

人们对自然和社会信息进行首次加工(固化)而成的文字记载,这是文献信息源的主要部分,数量极为庞大。

专著、报纸、期刊、专利文献、标准文献、会议文献、样本等成品文献属于一次文献。

2.二次文献(secondarydocument)

是通过对大量分散、无序的一次文献进行再加工,通过整理、提炼和压缩,并按其外部特征(题名、作者、文献物理特征)和内容特征序化,形成另一类新的文献形式——书目、索引、文摘,这就是二次文献。

二次文献的重要性在于它可以提供一次文献的线索。

3.三次文献(tertiarydocument)

在利用二次文献的基础上,选择有关的一次文献再加以分析、综合而编写出来的第三个层次的文献形式——专题报告、综述、进展以及手册、百科全书、年鉴等工具书,就是三次文献。

n从一次文献——>

二次文献——>

三次文献

n博——>

略,分散——>

集中,无序——>

有序

n一次文献:

文献的基础,是文献检索的对象

n二次文献:

是一次文献的简略和有序化,是文献检索的工具。

n三次文献:

是集中分散的一次文献,按知识门类或专题进行综合加工的产物,是文献检索的重要来源。

二、文献信息资源的类型

1.根据文献的载体形式划分印刷型缩微型机读型视听型

2.根据文献的编辑出版形式划分

3.按文献的结构等级(文献的加工程度)划分

 

1.图书(book)ISBN(InternationalStandardBookNumber)

定义:

指内容比较成熟、资料比较系统、有完整定型的装祯形式的出版物。

格式:

著者、书名[M]、版本(第1版不标注)、出版地、出版者、出版年、引文所在的起始或起止页码。

【例】BorkoH,BernierCL.Indexingconceptsandmethods[M].NewYork:

AcademicPress,1978

2.期刊(journal、periodical)ISSN(InternationalStandardSerialNumber)

是指那些定期或不定期出版、汇集了多为著者论文的连续出版物。

通常有数字或年月顺序编号,并打算无限期地连续出版下去的出版物。

期刊一般都有固定的刊名。

著者、题(篇)名[J]、刊名、出版年、卷号(期号)、引文所在的起始或起止页码。

【例】PorterMF,ZhangJ.Analgorithmforsuffixstripping[J].Program.1980,14(3):

130~137

3.会议文献(conference、paper)

会议文献是在各种学术、专题会议上发表的论文、报告稿、讲演稿等与会议有关的文献。

会议文献多数以会议录的形式出现。

是专业领域最新研究成果报道的一种主要方式。

文献著者、题(篇)名[A]、论文集名[C]、出版地、出版者、出版年、引文所在起始或起止页码。

【例】NealJ.TheDigitalImperative:

BuildingtheElectronicLibraryoftheFuture[A].'

98GeneralConferenceofInternationalFederationofLibraryAssociationsandInstitutes[C],Amsterdam,TheNetherlands,1998.

4.学位论文(dissertation、thesis)

高等学校或科研院所的本科生、研究生为获得学位资格(学士、硕士和博士)而撰写的学术性较强的研究论文。

著者、题(篇)名[D]、保存地点、保存单位、年份、引文所在起始或起止页码。

【例】CairnsRB.Infraredspectroscopicstudiesonsolidoxygen[D].Berkeley:

Univ.ofCalifornia,1986

8.政府出版物(governmentdocument)

政府出版物是各国政府部门及其所属机构发表、出版的文件,其内容广泛,概括可以分为行政性文献和科技文献两大类。

9.产品资料、技术档案等(productliterature、technicalrecord)

各厂商为推销产品而印发的商业宣传品,包括产品样本、产品目录、产品说明书、厂商介绍、技术座谈资料等。

企业或科研机构在技术工作中形成的、有一定的工程对象的技术文件。

如任务书、协议书、技术经济指标和审批文件、研究计划方案大纲和技术措施等。

各类型出版物特点比较

●内容新颖性:

期刊、会议文献、图书

●信息报道速度:

期刊、会议文献

●流通范围广度:

期刊、图书、会议文献、政府出版物

●发行量:

期刊、图书、会议文献

●易于获取程度:

期刊、图书、学位论文、会议文献、政府出版物

文献出版类型的辩识

(1)图书:

有出版社名称和出版年份。

(2)期刊:

包括刊名、卷、期、页码、月年。

(3)会议文献:

包括会议名称、时间、地址、会议录出版单位及其地址、出版年份、会议录提供单位及其地址、页码。

(4)学位论文:

一般著录学位和学位论文的名称,颁发的单位及地址、时间。

一、信息检索的概念

广义的信息检索:

是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程和技术。

全称为“信息存储与检索”。

狭义的信息检索:

指该过程的后半部分,即从信息集合中找出所需要的信息的过程,相当于人们通常所说的信息查寻。

二、信息检索的基本原理

是信息用户的需求和信息集合的比较与选择,即匹配(match)的过程。

用户根据检索需求,对一定的信息集合采用一定的技术手段,根据一定的线索与准则找出相关的信息。

三、信息检索的类型

1.根据信息的存储媒体和检索技术手段的不同,信息检索可分为:

手工检索:

通常使用的是一些印刷载体的工具书和检索期刊,检索过程由人脑和手翻书刊的配合来完成的,匹配是人脑的思考、比较和选择。

计算机检索:

使用的是检索系统。

系统包括计算机设备、终端、通信设施、数据库和检索、应用软件等。

2.根据检索对象形式的不同,信息检索可分为:

文献检索:

凡以文献检索工具(文摘、题录、全文等)为检索对象,是一种相关检索,不直接解答用户所提出的技术问题本身,只提供与之相关的文献供用户参考。

数据检索(数值检索):

以数值、图标等信息形式为检索对象的信息检索。

是一种确定性检索,直接回答用户所需要的确切的数据。

事实检索:

事实数据也被称作“基础资料”,它是指以直接提供可用的特定事实信息为目的的信息检索。

一、检索方法

文献检索的方法(查找文献的

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 求职职场 > 职业规划

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2