最新02117信息组织复习资料.docx
《最新02117信息组织复习资料.docx》由会员分享,可在线阅读,更多相关《最新02117信息组织复习资料.docx(34页珍藏版)》请在冰点文库上搜索。
最新02117信息组织复习资料
第一章
一.信息组织的含义
信息组织,即信息序化或信息整序,也就是利用一定的科学规则和方法,通过对信息外在特征和内容特征的表征和序化,实现无序信息流向有序信息流的转换,从而保证用户对信息的有效获取和利用及信息的有效流通和组合。
序是事物的一种结构形式,是指事物或系统的各个结构要素之间的相互关系以及这种关系在时间和空间中的表现。
二.信息组织在信息资源建设中的地位与作用
1.信息资源建设的基本内容与环节包括信息的采集,组织,开发和利用。
信息组织在其中属于关键因素,处于关节点的地位。
现在社会信息的基本特征是庞杂性和分散性,人们对信息需求的特点是专业的高度选择性,内容的精良性,时间的紧迫性。
2.信息组织是一个信息增值过程。
3.信息组织是信息生命周期管理思想的最积极,最活跃的因素,做好信息组织工作,会促进信息流通,发挥信息效用,使信息流形成良性循环,使信息在时间上更快速的传播。
4.信息组织是信息检索利用的基础。
三.信息组织的发展阶段
1.清册职能时间:
它主要通过对信息的记录和登载,如同“信息账房先生”,告诉人们有什么信息而已。
2.查检职能时期:
信息组织活动不仅告诉人们有什么信息,而且告诉人们怎样找到信息。
3.组织职能时期:
利用计算机技术,通信技术和网络技术已经不满足告诉人们有什么信息和怎样找到信息。
它不仅可以告诉人们我们这里有什么信息,而且还可以告诉人们其他地方有什么信息。
人们还可以知道什么信息适合于自己,可以多途径多角度地查检信息。
四.信息组织的理论基础
系统论,耗散结构理论和协同论使信息组织有了理论基础。
五.信息组织的方法基础
语言学,逻辑学,知识分类是信息组织的方法基础。
要把庞杂分散的信息组织成有序优化的整体,就必须建立符号系统,但都和自然语言一样,有着共同特征:
有语词,有词汇,有语法,这就是信息组织的语言学基础。
知识分类是一门研究知识体系结构的学问。
六.信息组织的基本方法
信息的外在特征和内容特征,它们是信息组织的基本对象和管理依据。
信息的外在特征:
就是指信息的物质载体所直接反映的特征,构成信息载体的外在的,形式的特征。
信息的内容特征:
就是信息所包含和承载的具体内容。
信息的序化和优化是信息组织的结果和目标。
信息的序化就是按照一定的方法将无序的信息组织成有序信息的过程。
信息的优化则是在序化的基础上,按照结构功能优化的目的对信息进行再序化的过程。
七.信息序化的基本方法P5(简答题
1.语法信息序化法:
即根据信息的外在特征,使用一套形式化的符号系统来组织信息的方法。
包括号码法,物名法,专门代码法,引证关系法,时序法,地序法。
2.语义信息序化法:
即根据信息的内容特征,使用一套含有语义的符号系统来组织信息。
语义信息序化法有分类法和主题法两种基本类型。
3.语用信息序化法:
就是指根据信息的实用价值来组织信息的方法,主要有权值序化法和逻辑序化法。
(1)权值序化法:
就是按信息的重要性来组织信息。
(2)逻辑序化法:
就是按某种逻辑关系来组织信息。
八.信息优化的基本方法
信息的优化主要包括信息的优选,浓缩,重新表述及三者的综合运用。
1.信息的优选正是实现社会信息有相对贫集向信息富集转化的优化过程。
2.信息的浓缩是使社会信息由博而约,由粗而精的一个信息加工过程。
信息浓缩的主要形式有文摘,题录,目录,词条。
3.信息的重新表述是使某些信息由不便利用向便于利用转化的加工过程。
信息重新表述有改写、编译、翻译等方式。
信息的综合优化是前述三种基本优化方法的结合运用,其主要形式是信息综述和信息述评。
九.信息组织的一般过程和原则
信息组织的一般过程包括信息替代和信息序化两部分了。
信息的替代过程(亦可成为信息揭示过程)实际上是对原始信息的外表特征(包括题名,著者,出处等)和内容特征(包括分类号,主题词,摘要等)进行表述的过程,这项工作通常称为著录。
信息序化是对替代信息给出信息标识的过程,这项工作通常称为标引。
信息组织与信息检索在实际操作中是两个互逆的过程。
通过信息检索可以进行信息组织质量的评价,通常我们在进行评价时惯用的两个指标是,查准率和查全率。
1.查准率简写为P,是指所检出的相关信息占所有检出信息的比率
查准率=检出相关信息量/检出信息的总量;
2.查全率简写为R,是系统在进行某一检索时,检出的相关信息量与系统信息库中相关信息总量的比率
查全率=检出相关信息量/信息库内相关信息总量。
十.信息组织的基本原则
1.客观性原则:
信息组织中进行描述和揭示的基本依据就是信息本身,因此,我们描述和揭示信息的外在特征和内容特征必须客观而准确,要根据信息本身所反映的各种特征加以科学地反映和序化,形成相应的信息组织成果。
2.系统性原则:
为实现系统性必须把握4个原则
(1)宏观信息组织和微观信息组织的关系。
(2)信息组织部门与其他部门的关系。
(3)信息组织工作的各个环节之间的关系。
(4)不同信息处理方法之间的关系。
3.目的性原则
4.现代化原则
第二章
分类法是以知识属性来描述和表达信息内容的一种信息处理方法。
分类语言是以数字,字母与数字结合作为基本字符,采用字符直接连接并以圆点作为隔离的书写法,以基本类目作为基本词汇,以类目的从属关系来表达复杂概念的一类检索语言。
传统的分类体系以枚举方式为特征(中图法的分类思想)
一.分类法
1.分类法的类型:
现今主要有两种类型分类法,一种是体系型分类法(《中图法》);一种是体系—组配分类法(UDC)。
体系型分类法是传统的分类法,它的特点是:
直线型的序列,层累制的结构,列举式的类目,码号式的语言。
体系—组配分类法,它的特点仍然有体系分类法的特点,但它增加了复分组配能力。
《中国图书馆分类法——中图法》是典型的体系型分类法,而《国际十进制分类法——UDC》是典型的体系——组配型分类法。
分类法通常由类目,号码,正表,附表,说明和索引等六个部分组成。
二.类目
1.类目:
类是一组在某一点上彼此相同或相似的许多事物的总称。
图书分类表的类就是一组在某一点上彼此相同的许多图书的总称。
每一类必须给予相应的名称,这就是类目,或称为类名。
所谓类目的内涵,是指这个类目所反映的图书有关本质属性,也即是类目的含义。
类目的外延则是指这个类目的适用范围,也就是这个类目所能包含的范围。
2.类目间的关系
(1)从属关系:
凡具有共性与个性,全局与局部,总论与分论关系的类目都可以看做从属关系。
例:
化学与有机化学
(2)同一关系:
即两个或两个以上的类目反映的是同一内容,它们有着同一的外延,但类名可以相同也可以相异。
例:
概率论(几率论,或然论)晶体学与结晶学
(3)交叉关系:
交叉关系又称交错关系,凡是相关类目都具有这种关系。
例;大学和共青团员
(4)并列关系:
同为某一类的下位类,但不含有互相反对或矛盾之意。
例:
原始社会制度,奴隶社会制度,封建制度,资本主义制度,共产主义制度。
(5)对立关系:
即两个类目所反映的图书内容彼此极端相反,但相加并不等于全体。
例:
无产阶级和资产阶级无机肥料和有机肥料
(6)矛盾关系:
两个类目所反映的图书内容相互排斥,但相加等于全体,即等于它的上位类。
例:
脊椎动物和无脊椎动物黑色金属冶金学和有色金属冶金学
三.号码
(简答题)
1、号码又称类号,即类目的代号,或称分类标识,它是代表各级类目的标记。
有关号码的要求主要是:
①逻辑性:
指该逻辑系统必须与类目的分类体系一致,使各级类号能够显示出类目在分类体系中的位置
②简易性:
指号码必须简短易写并便于使用
③伸缩性:
号码编制必须有一定的伸缩性,即便于类目的增减。
伸缩性也称弹性,要求在一定的地点、时间、条件下有它的相对稳定性,又要求随着地点、时间、条件的变化要有扩充发展或削减压缩的可能性
号码的类型及其编制方式:
(1)号码类型:
号码可分为单纯号码和混合号码两种类型
A.单纯的数字号码:
它与其他数字比较有着容易辨认,念读,记忆,书写,排列,检索的优点。
B.单纯的字母号码;由于它的基数较大,因而最大的优点是能组合较多的号码,而号码并不会太长。
但它的最大缺点是不易认,不易读,不易记,不易写,使用时常常会发生差错。
C.混合号码:
取上述两种号码的优点
(2)号码的编制方式:
顺序制,层累制,混合制。
(3)号码的编制方法:
(简答题时多写点)
A.间接编号法:
间接编号法也称留空位。
B.扩展编号法:
扩展编号法也称八分法。
C.双位编号法
D.借位编号法
E.起讫编号法:
起讫编号又称扩充编号。
F.连接编号法(采用冒号“:
”目的是连接原有两个相关类目的号码,重新构成另一个类目的号码)
G..辅助编号法:
“a”推荐符号只供马、恩、列、斯和毛泽东的著作。
“—”总论复分号“[]”交替符号“+”联合符号“()”国家区分符号“=”时代区分符号“<>”通用时间,地点区分符号“《》”民族区分符号。
四.正表
1.正表:
正表是整个文献分类表的主体,是分类体系的具体表现。
它的形式一般有:
基本部类表,基本大类表,主要类目表和详细类目表等。
(1)基本部类表:
由基本部类组成,基本部类又称为大部,或称为基本序列。
(2)基本大类表:
基本大类表又称为大纲,是在基本序列的基础上进一步展开而成。
(P25页的正表结构大类A----Z要记得)
(3)主要类目表:
主要类目表又称基本类目表,或称简表。
(4)详细类目表:
详细类目表又简称详表。
2.附表:
附表又称辅助表或复分表。
其主要功能是为了辅助正表的不足,便于正表各类目的扩充和展开。
(1)通用附表:
包括总论复分表,地域区分表,时代区分表,民族区分表。
(2)专类附表
(一)UDC:
国际十进分类表——UDC(UniversalDecimalClassification)是以杜威《十进分类法》简称DC或DDC为基础改进而编成的。
UDC的基本大类共十个
0总论
1哲学,心理学
2宗教,神学
3社会科学,法律,管理
4
5.数学,自然科学
6.应用科学(医学,工程学,农学)
7.美术,文艺,体育运动
8.语言学,文学
9.地理,历史
(二).UDC号码组配
符号名称应用
+加号并列符号
/斜杠表示彼此相互排列的十进分类号的连续扩充符号
‘撇号组配符号(也称合成符号)
:
冒号关联符号
4.UDC组配符号的使用
(1)并列符号“+”
(2)关联符号“:
”(3)扩充符号“/”(4)合成复分号“’”
5.UDC辅助表和辅助类号
(1)通用语言辅助号“=”(等号)
(2)通用类型辅助号“(0…)”
例:
(05)期刊,杂志,评论,年鉴。
(3)通用地区辅助号“(1/9)”
例:
(4/9)现代世界
(4)通用民族与种族复分号“(=)”
(5)通用时间辅助号“…”
(6)通用观点辅助号“.00”
第三章
一.标题法
1.主题法是以主题语言为基础描述和表达信息内容的一种信息处理方法
2.所谓主题语言,是指以自然语言的字符为字符,以名词术语为基本词汇,用一组名词术语作为检索标识的一类检索语言。
主题语言的发展经历了一个由严格规范到自由组配再到适当规范的过程。
主题法是文献检索工作中两大检索方法之一,它是一种文献主题标识和查找文献的依据。
3.标题法的含义:
这是主题法的最早类型,也称传统式主题法,又称字顺主题分类语言。
文献主题的内容是用规范化了的词或词组来标识,这个词或词组就是所谓文献的标题,把它们按字顺排列起来就成为标题表。
4.标题词词组语法:
正叙式(如:
DIESELEGINES柴油机),倒叙式(如:
PIPE,COPPTER铜管),并列式(如:
BOLTSANDNUTS螺栓和螺帽),形容词+名词(如:
OpticalProperties光学性质),动词+名词(如:
AmplitudeModulation),名词+名词(如:
ElectronBeams电子束),名词+介词+名词(如:
FlowofFluids流体),复合名词+动名词(如:
CoalminesandMining煤矿与采矿)
5.标题语言的缺点:
(1)缺乏按学科专业概念进行族性检索的能力。
(2)缺乏描述复杂概念较高专指度的能力。
(3)缺乏具有多种途径检索和自由扩检的能力,它的扩检和缩检的能力。
二.叙词法
1.叙词的含义:
叙词语言是以规范化科学名词作为基础的一种主题法检索语言。
以主题词(叙词)作为文献内容标识和查找的依据,它是从自然语言中优选出来的经过规范化处理的名词术语。
它是一种后组式语言。
2.叙词的性能:
叙词的优异检索性能,首先在于它是一种后组式检索语言,可以自由地进行广泛的组配,形成各种专指标识,扩大或缩小检索范围,以及进行多维性,多途径检索等。
(1)保留了单元词组配的基本原理
(2)采用了标题法对词语进行严格规范化的方法,以保证词与概念的一一对应
(3)采用了体系分类法的基本原理,编制叙词分类索引(范畴索引)和等级索引(词族索引)
3.叙词的作用:
直观性,单义性,组配性,网罗性和专指性,多维检索性,语义关联性,计算机检索与手工检索的兼容性,现代科学技术的适应性。
(简答题P48要再加点内容)
三.叙词表
1.叙词表的体系结构有5部分:
(简答题)
(1)叙词字顺表:
又称叙词表的主表。
它给出叙词表收录的全部叙词和非叙词,并有标注事项和显示词间关系的参照系统
(2)分类索引:
又称范畴索引。
将叙词按其概念所属学科或范畴分成若干大类,在大类下再分小类,在小类下则将叙词按字顺排列,形成一个类似体系分类表的概念分类系统
(3)等级索引,又称词族索引。
利用概念的属分关系,将具有属分关系的叙词汇集在一起成为一族,构成一个从泛指叙词到专指叙词的等级关系
(4)双语种对照索引。
提供了另一种语言字顺入手查词的途径
(5)附表。
它是主表的一种特殊形式,是主表主题词的组成部分。
2.主题词款目实例
(1)主题词款目著录各项含义P50(属分关系图)
A.款目主题词B.范畴号C.用代项和组代项D.属分项E.参项F.族首词项G.词义注释H.范围注释
3.叙词表作用:
把款目主题词、款目主题词的汉语拼音、英文译名、范围分类号、注释和参照项等项目组成款目结构。
检索语言或词表的主要作用在于:
控制标引与检索用语,使用同一主题或相关主题的文献集中,并通过系统化组织文献。
4.范畴索引:
是将主表的全部主题词按照主题词的学科和词义范畴,划分为若干大类,二级类或三级类,每类之下再依主题词的汉语拼音字顺排列的一种索引。
汉语主题词表,根据主题词表的专业特点、主题词的数量和实际需要,范畴索引共设置了五大部58个大类,674个二级类,1080个三级类。
范畴索引的分类原则还是以学科为主,词义为辅,把学科性质和概念性质相近的主题词归并在一起而形成各个大类。
5.“范畴索引”类目的标记符号:
(1)双位数字法
(2)双位字母法(3)字母与数字相结合的方法。
6.范畴索引的作用
(1)分类的角度查找主题词,作为标引和检索图书资料起属性作用的一种辅助工具。
(2)对图书资料进行分门别类编辑,通报,交流,发行和组织手检分类主题目录工具。
(3)范畴索引又可以作为一种编制主题词表的辅助工具。
对选词,编制参照等工作能起到分工协调和检查遗漏的作用。
四.词族索引
1.词族索引的含义:
词族索引又称族系索引,等级索引,词族表。
它是主表中具有种族关系,部分与整体关系和包含关系的正式主题词,按其本质族性展开全显示的一种词族系统。
即这一词族中概念最大的主题词,叫做族首词,或叫做顶端主题词。
2.词族索引的款目结构:
将全部词族索引以族首词款目的字顺和等级相结合的方法表示的称为词族索引。
族首词就是指能概括一族主题词的最上位概念的词,它列在一族之首,并在其右上角有“*”号。
3.词族索引的作用:
(1)满足族性检索需要
(2)起自动扩检和缩减的作用(3)限定词义,提高标引和检索时选词的准确性,专指性。
五.英汉对照索引:
就是将英文与汉语主题词互相对应,并按英文字母顺序排列的一种索引。
《汉语主题词表》的英汉对照索引分为六大块,即:
主表主题词表的英汉对照索引(2块)和附表主题词表英汉对照索引(四块)。
六.附表:
附表是主表的一种特殊形式,是主表主题词的组成部分。
七.关键词
1.关键词的含义:
所谓关键词,是从文献资料的正文,摘要或书名,篇名中抽出的并在表达文献内容主题方面具有实在意义起关键性作用的词汇。
因为这些具有实质意义的词汇,对能否检索到这篇文献起着关键性的作用,所以称为关键词。
2.关键词的性质:
关键词与标题词、单元词、叙词童属主题法系统的检索语言。
(1)关键词法基本上不作规范化处理,或仅作极少的规范化处理。
其明显不同是:
标题词,单元词和叙词都需要词表,关键词则不存在所谓的词表。
(2)关键词是文献中现成的词汇,是一种自然语言。
因而,关键词能够达到任意的专指度和泛指度。
(3)关键词是一种非控制的语言,因而能用计算机进行自动抽词标引,这样可大大加速文献的标引过程。
3.关键词的规范:
关键词方法的基本原理,是把信息的主题分拆为单位概念,然后对这些概念加以组配,以实现信息的存储和检索。
(1)对非关键词进行规范,编制非关键词表。
(2)对文献题名作吧必要修改。
(3)对一些词和符号进行改写。
(4)缩略与拆同。
4.关键词的缺点:
(1)同义词语近义词的问题
(2)同一主题的文献可能分散在不同的关键词名下,因而可能产生漏检,影响查全的效果。
(3)表达主题的专题性,准确性较差,因而容易产生误检,影响查准的效果。
(4)计算机检索时,需要扫描的款目较多,因此,关键词索引比较适用于数量不太多的文献。
八.题内关键词
1.题内关键词的含义:
就是从文献篇名中抽取的关键词为题内关键词。
英文名称为KeywordinContextIndex,简称KWIC.
2.题内关键词的特点:
优点:
(1)在列出关键词时,同时保留了题目中的非关键词,而且词序不变。
使检索者对题目中的各个关键词之间语法关系有一个清晰的了解,帮助检索者更好地理解文献的中心内容。
(2)由于这种索引便于采用计算机编排,因而编制容易,速度快,报道传播信息及时。
缺点:
(1)同义词,单复词无法规范。
因而使同一主题的文献,因关键词的词形不同而被分散,影响查全的性能。
(2)揭示文献的专指性,准确性受到影响。
由于抽词主要取决于文章题目,因此可能使许多重要信息得不到充分的反映。
P63文献的著录格式
九.题外关键词
1.题外关键词的含义:
除题名外,从文献正文中抽取的关键词,称为题外关键词。
这种索引的英文名称为“KeywordoutofContext”,简称“KWOC”.
2、题外关键词索引是为了克服题内关键词索引存在缺点而编制的一种索引,最大特点是关键词的抽词不局限于文章的标题,包括从文摘甚至正文中抽取最能反映文献主题内容的关键词。
抽出的几个关键词也采取轮流编排,但没有上下文结构,节省了索引的篇幅。
十.参照系统
Y(用)——USED(代)——UFS(属)——BTF(分)——NT
Z(族)——TTC(参)——RT
1.See的含义:
“S”就是把不是主题词的词,通过它引见到作为主题词的词。
“SeeAlso”用它来联系相关的主题词,进一步扩大检索的范围。
2.See的实例见书P68
十一.叙词与叙词,非叙词间概念逻辑关系P70
(1)同一关系:
同义词,近义词,多义词
(2)等级关系
(3)相关关系
十二.分类主题一体化词表大致可以分为以下三种类型:
(1)分面叙词表
(2)分类主题词表(3)集成词表
第四章
一.标引与著录
1.标引:
是对文献进行主题分析,从自然语言转换成规范化的检索语言的过程,即对主题分析结果赋予检索标识的过程。
2.分类标引:
就是将文献主题的自然语言形态,转换成分类语言形态的一种标引,也就是将文献主题转换成分类号的一种标引。
因此,分类标引是一种直接对文献主题,采用某种号码标识的标引。
这种标引是建立分类检索系统的依据。
3.分类标引包括分类和归类两个概念。
(1)所谓分类,就是将大量的图书信息,根据它们的内容性质,形式体裁,立场观点和读者用途上的异同,按照图书分类体系,由上而下,由大到小。
由整体到部分,由一般到特殊,由总论到分论的层层划分,这样就可以把相同的图书集中在一起,相近的连接在一起,不同的则区别开来,整理成为有条,有理的系统,在进行时须运用概念的缩小。
(2)归类,即是运用这个体系来分类图书,它是由下而上,由小到大,由部分到整体,由特殊到一般,由分论到总论的集合过程,在进行时须运用概念的扩大。
4.分类标引的优点:
(1)在于它具有达到较高查全率的族性检索性能,有利于从学科或专业范围角度进行全面检索。
(2)另一种独特的优越功能就是组织图书资料的排架,其他检索语言就没有这种可能。
5.分类标引的任务:
(1)揭示每种书,每篇文章的内容性质,形式体裁,立场观点和读者用途,只有这样才能针对不同用户提供所需的不同文献。
(2)把相同的文献聚集在一起,把不同的文献区别开来,只有这样才可以使用户因类以求。
(3)根据各类文献之间的关系组成一个系统,只有这样才能科学地组织,管理文献。
6.为了能较好完成上述任务,对文献分类标引的要求是:
(1)充分性,即是充分揭示文献的内容,性质,形式和用途。
(2)针对性,即是文献分类标引必须有的放矢。
(3)准确性,即要求分类标引做到迅速,及时,不积压。
(4)一致性,即是说同性质的文献,必须归到同一类;同一种文献的不同复本,版本或卷次必须归到一处。
7.分类标引的一般分类原则:
(1)科技图书根据内容性质和形式体裁归类
(2)文艺作品根据文艺形式体裁归类
(3)综合性图书根据编制形式体裁归类
(4)揭示图书内容的政治方向
(5)根据作者写作目的和书中主要意旨归类
(6)要遵循图书分类法本身的逻辑性和系统性
(7)必须保持分类与编目的一致性
(8)先归入主要类,必要时互见其他类或作分析
(9)先按学科性质归类,后按地域,时代归类
(10)一书的研究,评论,解说应随原书归类
(11)不要单凭书名归类或按临时需要归类
8.两个主题分类标引P93:
并列关系(如:
动物与植物),从属关系(如:
物理化学及胶体化学),因果关系(如:
血吸虫及血吸虫病),影响关系(如:
植物与光),比较关系(如:
资本主义和社会主义制度的婚姻道德),应用关系(如:
优选法在金属切削中的应用)。
二.专业信息部门分类标引
1.针对分类表盒本信息机构的特点,在文献处理上应采取如下措施:
(1)在不违背科学性的基本前提下,尽量进行专业集中
(2)尽量对有关本专业的资料进行细分
(3)尽量将与本专业有关的一切文献资料在本专业类目下完全揭示出来。
三.主题标引
1.主题标引是对文献进行主题分析,并给予主题词标识的过程。
它以文献篇名和文献为依据,必要时参考全文的内容,考虑检索途径的全面性和表达主题的专指性,充分利用词表提供的各种辅助选词手段,充分反映馆藏特点和各类用户的要求。
2.标引质量:
(1)标引的准确性
(2)标引深度:
指对一篇文献所给予的全部检索标识的数量(3)标引的一致性:
是指同一个标引人员对同一篇文献在不同时间的标引是否一致。
3.标引规则的意义:
标引误差主要来源于不遵守标引规则,而检索误差在很大程度上也是由于不了解标引规则。
主题标引可分为一般规则,专指性标引规则,组配标引规则,上位词标引规则,近义词和增词标引规则。
标引规则是保证标引质量的依