信息组织复习资料.docx

上传人:b****3 文档编号:10582406 上传时间:2023-05-26 格式:DOCX 页数:21 大小:29.39KB
下载 相关 举报
信息组织复习资料.docx_第1页
第1页 / 共21页
信息组织复习资料.docx_第2页
第2页 / 共21页
信息组织复习资料.docx_第3页
第3页 / 共21页
信息组织复习资料.docx_第4页
第4页 / 共21页
信息组织复习资料.docx_第5页
第5页 / 共21页
信息组织复习资料.docx_第6页
第6页 / 共21页
信息组织复习资料.docx_第7页
第7页 / 共21页
信息组织复习资料.docx_第8页
第8页 / 共21页
信息组织复习资料.docx_第9页
第9页 / 共21页
信息组织复习资料.docx_第10页
第10页 / 共21页
信息组织复习资料.docx_第11页
第11页 / 共21页
信息组织复习资料.docx_第12页
第12页 / 共21页
信息组织复习资料.docx_第13页
第13页 / 共21页
信息组织复习资料.docx_第14页
第14页 / 共21页
信息组织复习资料.docx_第15页
第15页 / 共21页
信息组织复习资料.docx_第16页
第16页 / 共21页
信息组织复习资料.docx_第17页
第17页 / 共21页
信息组织复习资料.docx_第18页
第18页 / 共21页
信息组织复习资料.docx_第19页
第19页 / 共21页
信息组织复习资料.docx_第20页
第20页 / 共21页
亲,该文档总共21页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

信息组织复习资料.docx

《信息组织复习资料.docx》由会员分享,可在线阅读,更多相关《信息组织复习资料.docx(21页珍藏版)》请在冰点文库上搜索。

信息组织复习资料.docx

信息组织复习资料

第一章信息组织引论

1、什么是信息组织(信息组织是对资源对象进行收集、加工、整合、存储使之有序化、系统化的过程。

组织信息的目的是为了检索信息、利用信息。

图书馆、情报所、文献中心、档案馆、专利局等是人们长期进行组织信息和提供信息的场所)

2、信息组织的发展阶段1)按职能划分信息组织发展阶段(清册职能时期查检职能时期组织职能时期)2)按组织对象划分信息组织发展阶段(文献组织阶段信息组织阶段知识组织阶段)

3、信息组织的理论基础(系统论、耗散结构理论、协同论)

4、信息组织的方法基础(语言学逻辑学知识分类学)

5、网络一次性资源的组织方法

1)超文本方法:

超文本是一种新型的信息组织方法,是网络信息组织的基础。

2)自由文本方法:

主要用于全文数据库的组织,是对非结构化的文本信息进行组织和处理的一种方式

3)主页方式:

类似于档案全宗的组织方式,它将有关某机构或个人的各种信息集中组织在一起,是对某机构或人物等各类对象的全面介绍

6、主题树方法组织信息资源的优点与缺点:

优点:

主题树屏蔽了网络资源相对于用户的复杂性,提供了一个基于树浏览的简单易用的网络信息检索与利用界面.信息检索由用户按照规定的范畴分类体系,逐级查看,按图索骥,目的性强,查准率高。

采用树形目录结构组织信息资源,具有严密的系统性和良好的可扩充性

缺点:

必须事先建立一套完整的范畴体系。

为了保证主题树的可用性和结构的清晰性,范畴体系的类目不宜过多,每一类目下的信息索引条目也不宜过多,这就大大限制了一个主题树体系所能容纳的信息资源的数量。

7、自动分类标引技术

1)自动归类:

自动归类是指先分析待分类对象的特征,将其与各种类别中对象具有的共同特征进行比较,再将待分类对象归入特征最近的一类并赋予其相应的分类号

A)基于词的自动分类:

核心是把从待分类文本中抽取的代表知识主题的语词与分类系统中代表各个类目含义的语词进行相符性比较,把分类对象归入相符程度最高的类中。

B)基于专家系统的自动分类:

核心是知识库和知识表达,知识库是人工建立的分类体系、语义网络和分类规则等,知识库的规模影响着系统的智能水平。

2)自动聚类:

是指从待分类对象中提取特征,再将提取的全部特征进行比较,并按一定原则将局域相同或相近特征的对象定义为一类,设法使各类包含的对象大体相等。

一般是在语词共现的基础上,通过词频统计和相似性比较加以聚类的。

8、信息组织研究的主要内容:

(信息采集、信息识别、信息资源描述、信息资源标引、信息整合、信息存储与整序、信息利用等)

9、信息资源描述:

(是指根据信息组织和检索的需要,对信息资源的内容特征和形式特征进行分析、选择和记录的活动。

10、ISBD的含义:

InternationalStandardBibliographicDescription国际标准书目著录

年份:

1971年国际图书馆协会联合会编目委员会发布

11、AACR₂的含义:

Anglo-AmericanCatalogingRules英美编目条例第二版

年份:

1978年,在第一版的基础上根据国际编目标准调整后出版

12、MARC的含义:

机器可读目录MachineReadableCatalogue简称机读目录

13、信息资源标引:

含义:

也称文献标引,是指分析文献的内容属性(特征)及相关外表属性,并用特定语言表达分析出的属性或特征,从而赋予文献检索标识的过程

过程:

主题分析转换标识

14、标引语言的特点:

简明性即标识的形式简洁、含义明确;单一性即标识与概念唯一对应,排除了同义现象与多义现象;关联性即标识之间建立了联系,以反映概念之间的关系

15、分类标引:

是指对文献进行主题分析,用分类语言表达分析出的主题,赋予文献分类检索标识(分类号)的过程

16、主题标引:

是指对文献进行主题分析,用主题语言(主题法)表达分析出的主题,赋予文献主题检索标识(标题词、叙词等)的过程

第二章信息资源管理的分类语言

1、《中图法》的基本大类(也称分类大纲,是分类法中划分的第一级类目,是在基本序列基础上展开的知识分类体系框架)共有22个,

基本序列(也称基本部类或部类,是分类法编制中为建立知识分类体系,对知识门类所进行的最概括、最本质的划分与排列,是确定基本大类的基础)有五个(马克思主义,列宁主义,毛泽东思想,邓小平理论;哲学,宗教;社会科学;自然科学;综合性图书)

2、八分法的概念;又称扩九法,即当某序列的同位类类号标记到8,且尚有若干同位类待标记时,则9本身不用,扩展为91、92、93……99,为第九个及以后的同位类配号。

一般在同位类超过9个少于18个时使用

3、双位制的概念:

双位制又称百分法,即在某类目下将用于配号的数字1~9不直接使用,而是分别扩展为双位数字标记其下属同位类目的编号法。

一般当同位类相当多时,为避免号码冗长,采用双位制编号法

4、借号法的概念:

是采用层累标记制时为了增加类列的容纳性而采用的借用上位类、下位类、同位类类号的一种编号方法

5、中图法运用组配技术的四个方面:

编制各种类型的通用复分表,作为全表各级类目组配复分的依据;

在有关类编制专类复分表,作为某些类目组配复分的依据

规定部分类目可以仿照已列出的类目进行细分,即类目仿分

主类号之间使用冒号直接组配,合成新的类号

6、杜威十进分类法:

英文:

DeweyDecimalClassification

年份:

1876年问世

基本大类个数:

10个

标记制度:

采用单纯的阿拉伯数字做基本标记符号,所有数字作为小数理解,前三级类一律用三位数字标记,前三位数字之后用小圆点隔开,基本按层累制编号

特点:

类目体系完整,覆盖全部知识、文献;类目详尽,等级分明,便于理解使用

首创以简明的号码标记类目的方法,便于图书排架、目录组织和检索

首次采用小数标记制

首次使用了复分和仿分的方法

首创了图书分类法的类目相关索引

成立了常设管理机构,不断修订更新,保持分类法的长久生命力

7、国际十进分类法:

英文:

UniversalDecimalClassification

年份:

1905年法文第一版

大类个数:

9个

特点:

较早较全面地采用概念分析与综合原理及冒号组配技术,是世界上第一部半分面分类法

类目详尽,详本类目多达15~21万个

标记制度灵活,辅助符号多达10几种,表达概念能力强

修订不及时,类目体系陈旧,组配过于复杂

8、国会图书馆图书分类法

英文:

LibraryofCongressClassification

大类个数:

21个

年份:

1902年Z大类首先出版,1948出版了除K(法律)大类的各大类类表,1969~1977K大类的各类表陆续出版

特点:

类目体系有文献保证,因而实用性强

列类详细(尤其在人文、社会科学部分),类目超过23万个,是世界上类目最多的一部分类法

是典型的列举式分类法,较少采用组配方法。

没有通用复分表,各大类几乎分别编有地区、形式、主题等专用复分表,各大类复分表的类目设置和配号均不相同

类号较简短,容纳概念的能力较强

有专门的机构负责修订,及时反映新的变化

9、冒号分类法:

作者:

印度图书馆学家阮冈纳赞年份:

1933年分面组配符号:

冒号

10、体系分类法的概念:

又称等级分类法、列举式分类法,是一种直接体现知识分类的等级概念标识系统

11、分类应当遵守的规则:

唯一性:

在每一次划分时,只使用一个划分标准,不同时使用两个或两个以上的划分标准,否则会出现划分后所得各子类互相交叉、重叠的混乱现象

完整性:

划分后所得各子类的外延之和应等于其母类的外延,避免“不完全划分”的错误和“多出子类”的错误

科学性:

要选择事物本质的、符合分类目的的属性作为划分标准,否则分类便失去科学性和实用价值

12、创制组配分类法的目的:

主要是为了克服体系分类法的列举式列类方法多造成的不能无限容纳概念的局限性,以及它的类目的单线排列方式所造成的“集中与分散”的矛盾

13、体系分类法的宏观结构:

1)分类表:

定义:

也称类目表,是根据类目之间的关系,按照一定的原则组织起来的类目一览表

组成:

从表现形式上看,分类表一般由大纲、简表、主表、辅助表几部分组成

2)编制和使用说明:

分类法的编制说明一般是对分类表的编制目的和适用范围、编制原则、体系结构、辅助表、标记符号、注释等予以介绍和解释,以使人们对分类表有一个基本的、全面了解。

3)索引:

分类法索引,又称类目索引,它是一种按类名及类目相关概念名称字顺查找相应类号的类表辅助工具

14、类目的组成:

类号、类名、类级、注释和参照

15、组配分类法的类型;

分面组配分类法:

分面组配分类表由编制说明、分面类表目次和若干分面类表组成

组配—体系分类法:

组配—体系分类吧由编制说明、基本类表、一系列分面类表和分面公式以及若干通用辅表组成

体系--组配分类法:

体系—组配分类表由编制说明、大纲或简表、分类体系详表(主表)、许多专类辅表和若干通用辅表组成

16、现有分类法在组织网络信息时具有以下优势:

由于限定了检索范围,可以提高查准率,

分类等级结构可以提供检索词的上下文,自动索引结构便于用户在查找时进行浏览,检索目的不明确或者检索词不确定时,分类浏览方式更有效率

以知识分类为基础,以符号为标识,具备成为不同语言转换中介的条件

非文本信息在网络信息资源中所占比例日益增大,其内容特征难以用文字表达,分类法

的聚类功能及号码标识为之提供了一条可能途径

17、现有分类法用于纸张信息组织时的调整:

将分类法的文献保证扩展到包括Internet信息资源,增加必要的新类目

修订类名,增强其表达性和通用性

分解和标记类号的组成因素,以识别它所表达的特定主题和主题方面

不断增加新的术语作为索引词

扩展分类法与其他受控词表的联系

控制使用类目的深度,多数网络分类检索系统只使用分类法的1~3级类目

18、自编分类系统的种类1)等级式主题分类法系统2)分面组配分类法系统

3)学科分类法系统

19、自编分类系统的特点:

1)重视以事物为中心设置类目:

并不完全放弃从学科的角度组织网络资源,但大多从便利用户使用出发,直接以检索的事物为中心设置类目,设置很少或干脆不设置学科角度的类目

2)类目收录范围宽泛:

下位类不仅收入该类的从属类目,而且收录各种相关类目,使得一些类目的下位类数量大大增加,远高于传统文献分类法同级类目的数量。

3)多重列表,重复反映:

采用多重列类的方法,对网络信息重复反映,结合使用链接技术,还对交叉学科、总论与专论、相关类目等横向联系重复揭示,以特定符号对重复反映的类目加以标示

4)排列方式简便:

有字顺方式与检索频率来确定同位类的排列,字顺方式可以方便用户对特定类目的查找,也有利于简化新类的增补;列举高频类,突出热门主题,方便多数用户使用

5)直接以语词组织信息:

直接以语词表达类目体系,采用链接技术连接网络文献,通过在子类上方显示其类系的方式,揭示类目展开的等级

6)更新迅速:

类目的调整受原有体系的束缚较少,可以根据网络资源的发展变化及时增设新类或重复反映相关类目等,往往具有较大的动态性

20、网络分类系统中存在的问题:

1)类目设置缺乏规律性:

不少系统同位类展开多元,同时采用多个标准,有时还同时列出不同等级的类目,使得类目设置缺乏规律性

2)类目归属存在着不合理现象:

确定类目的下位类时相关类收入范围过宽导致收入一些超出母类外延的类目;未能按照知识之间的关系合理确定类目的归属。

3)同位类排列不能揭示类间关系:

缺乏对知识门类系统显示的能力和揭示类目相关性的作用,造成类目关系的混乱

4)横向关系揭示上存在不一致:

处理过程中缺乏一致性及对范围的适度控制,过度将具有相关关系的类目集中于一个类下,会影响查准率

5)部分类名不确切:

不能确切概括类目的内涵,使类目的含义和范围难以确定,影响使用效果

6)分类规则有待完善:

多数系统没有建立适合网络文献特点和符合网络分类体系的比较充分的标引规范,影响标引的准确性和一致性,无法充分揭示有价值的网络文献,造成标引质量降低,影响实际检索效果

第三章信息资源组织的主题描述语言

1、标题的概念:

是主题标目(SubjectHeading)的简称,它是直接表达文献主题的标识,大多数是对文献内容所论及事物名称及特征的规范表达

2、标题的性质:

直接性、直观性、受控性、语义关联性、先组性、示范性

3、标题语言的特点:

1)用受控的自然语言语词做标识,直观地表达主题概念,直接地标引文献

2)以字顺序列组织标识,提供直接的主题检索途径,有利于进行特性检索

3)主要用参照系统间接显示标题所表达的主题概念之间的关系,形成语义网络,能为选用标题进行标引和检索提供一定方便

4)按事物集中文献,而不是按学科、专业集中。

5)提供先组式的主题标识,标识含义比较明确,选用标识比较容易

6)标引所选用的标题不必都是标题表所列举的现成标题

4、标题表的作用

1)登陆经过控制的标题(正式标题)和非标题(非正式标题),并不断予以更新完善,是标引和检索选用标题的依据

2)不仅按字顺组织标题和非标题,而且用参照系统显示标题之间以及非标题和标题之间的关系。

既便利查找和准确选用标题,又便于检索时的扩大、缩小和改变检索范围

3)详细的注释和说明提供标引和检索使用标题的方法指示,为正确、一致地使用标题提供保证

4)体现标题控制的原则,提供标题控制的示范。

标题表的使用者可以根据规则拟用标题表没有列举的标题

5、叙词语言的原理:

1)保留了单元词法单词组配的基本原理

2)采用了组配分类法的概念组配来代替单元词法的字面组配,以及适当采用标题法的预先组配方法(即采用词组),以克服某些词分拆后再组配时产生意义失真的缺点

3)采用了标题法对语词进行严格规范化的方法,以保证词与概念的对应

4)采用并进一步完善了标题法的参照系统,采用了体系分类法的基本原理编制叙词分类索引(范畴索引)和等级索引(词族索引),采用了与关键词法类似的方法编制叙词轮排索引,从多方面显示叙词间的相关关系,以保证准确、全面地选用叙词进行标引和检索

6、关键词法的定义:

是指那些出现在文献的标题(篇名、章节名)以致摘要、正文中,对描述文献主题内容

具有实质意义的语词,亦即对提示和描述文献主题内容来说是重要的、带关键性的(可

以作为检索入口的)那些语词。

7、关键词语言的原理:

1)直接地抽取文献中或题名中的语词做标识,对作为标识的词不加规范或只作极少量规范处理。

2)不编制受控词表来进行词汇控制,不显示词间关系,只是编制禁用词表(非关键词表)来控制抽词

3)每个关键词都是平等的,都按字顺轮流排至检索位置,提供多途径的主题字顺检索

8、关键词索引的类型:

1)题内关键词索引(KWICindex):

又称上下文关键词索引,是最早出现的关键词索引形式,也是最早利用计算机编制的一种索引

每个款目占一行,有三个部分:

作为检索入口的关键词,位于中间;作为修饰词的上下文;包括将轮为关键词和总是非关键词的词,居于关键词前后;作为文献地址的文摘号,位于最后

2)题外关键词索引(KWOCindex):

将检索入口位置放在题名之外,即将检索入口的关键词置于题名的左端或左上方,题名的次序不变,款目依检索入口位置的关键词字顺排序,款目的最后也是文献地址

3)双重关键词索引(DKWICindex):

指一个款目有两个关键词作双重标目(一个主标目和一个副标目)的关键词索引

4)单纯关键词索引:

是指款目不包含非关键词,纯粹由多个关键词及文献构成款目并轮排的关键词索引

5)词对式关键词索引:

是每次只取文献多个关键词中的两个配对构成索引款目并轮排的关键词索引

6)简单关键词索引:

这是索引款目只有一个的关键词索引,一般每个关键词后悔有许多个文摘号

9、关键词语言的缺点:

1)由于关键词法直接采用文献中的自然语词作关键词,对自然语言中大量存在的等同关

系词不加规范统一,也不显示等同关系,使相同主题文献常因作者用词不同而被分排

各处且无联系,导致漏检的可能性较大

2)关键词法不显示关键词之间的等级关系和相关关系,难以进行族性检索,特性检索的查全率也不高

3)为了加速和简化检索工具的编制过程,多限于从文献标题中抽取。

由于一些标题对文献内容的表达不充分或不准确,会使关键词检索有一定的漏检或误检

4)在机编索引情况下,由于机械地抽词和轮排,其中有不少关键词款目是不起检索作用而徒增篇幅的

10、关键词语言的优点:

1)标引时无需主题分析和查看词表,简便易行,因而降低对标引人员的要求,节省大量人力。

2)标引和索引编制易于实现自动化,从而显著节省时间,大大缩短检索系统信息组织和报导的时差,保证信息报导和传递的及时性

3)关键词是文献中使用的自然语词,表达主题比较直观、专指,可以保证较高的查准率

第五章信息资源描述的元数据方案

1、元数据的定义:

元数据是关于数据的数据,同时也是结构化的数据。

它对信息资源进行描述和解释,促进信息资源的检索、管理和利用。

元数据可以为各种形态的信息资源提供规范的描述方案和检索工具,为分布的、由多种信息资源组成的信息系统(如数字图书馆)提供整合的工具和纽带

2、元数据的功能:

1)支持资源发现:

支持多种方式检索信息;可以识别信息资源,根据元数据内容对信息资源进行聚类;区分不同的信息资源;定位具体的信息资源。

2)组织数字信息资源:

可以对各类数字信息资源进行组织,通过对网页、电子期刊、电子图书进行元数据描述形成元数据数据库

3)支持资源的互操作:

容易通过机器进行处理,许多元数据方案采用xml格式进行表示,通过各类元数据间的映射解决资源互操作问题

4)支持数字识别:

元数据往往包含资源的唯一标识,可通过元数据识别具体的信息资源

5)支持存档和保存:

通过记录信息资源的格式、产生、变化等方面的信息,保证资源的持续可访问性

3、元数据的结构:

1)内容结构:

定义元数据的构成元素,可包括:

描述性元素、技术性元素、管理性元素、结构性元素。

2)句法结构:

定义元数据的格式及其描述方式,包括元素的分区分段组织、元素选取规则、元素描述方法、元素结构描述方法、结构语句描述语言等

3)语义结构:

语义结构定义元素的具体描述方法,体现元数据的语义特征。

4、都柏林核心元素:

Title资源名

赋予资源的名称

Creator创建者

创建资源内容的主要责任者

Subject主题词和关键词

有关资源内容的主题描述

Description说明

对资源内容的说明

Publisher出版者

使资源成为可以取得和利用状态的责任者

Contributor其他责任者

对资源内容创建做出贡献的其他责任者

Date日期

与资源本身生命周期中的一个事件相关的日期

Type类型

有关资源内容的特征和类型

Format形式

资源的物理或数字化的表现形式

Identifier资源标识符

在给定的文本环境中对资源的参照引用

Source来源

对一个资源的参照,而当前资源是源自这一参照资源

Language语种

描述资源知识内容的语种

Relation关联

对相关资源的参照

Coverage覆盖范围

资源内容所涉及的外延与覆盖范围

Rights权限管理

有关资源本身所有的或被赋予的权限信息

5、MARC21每条marc记录的四个区:

头标区、目次区、数据区、记录结束符

6、856字段中资源的存取方法和定位:

1)存取方法:

0——email通过电子邮件传输协议存取

1——ftp通过文件传输协议存取

2——telnet通过远程登录存取

3——dail-up通过电话线拨号存取

4——http通过超文本传输协议存取电子资源

7——专用于子字段$2里的方法

2)联系:

0——表示资源

1——表示资源的版本

2——表示相关资源

3)子字段代码:

$a——主机名

$b——存取号(internet协议数字地址)

$c——压缩信息

$d——路径

$f——电子资源文件名

$g——统一资源名

$o——操作系统

$s——文件尺寸

$u——统一资源地址

7、CNMARC:

是中国机读目录的缩写,于1989年底发型书目文献记录的数据磁带和软盘,是依据UNIMARC以及我国出版物的一些特殊情况和规则的新变化而编制的

8、不同的元数据方案在以下层面上具有差异性:

1)语义差别:

不同元数据体系间没有绝对的对应关系,有时是语义不同,有时则根本没有可对应的元数据

2)句法差别:

即使元素语义完全相同,如果哦句法不同,数据也会以不同方式记录。

3)结构差别:

结构的复杂程度导致了不同元数据方案在结构上的差别

9、语义互操作的概念:

是指在元数据的共享和通信过程中,共享和通信的双方能够理解元数据的语义,如理解

元素表达的含义,在语义层面上达成一致

10、元数据映射:

就是为一种元数据格式的元素和修饰词在另一种元数据格式里找到有相同功能或含义的元素和修饰词,元数据映射可以解决几种格式间的统一检索。

11、RDF资源描述框架:

RDF资源描述框架是一个描述资源特征及资源间关系的框架,利用它可以实现各种元数据之间的互操作

资源:

是所有在web上被命名、具有url的对象。

描述:

是对资源属性的一个陈述,以表明资源的特性或者资源之间的联系。

框架:

是与被描述资源无关的通用模型,以包容和管理资源的多样性、不一致性和重复性

12、z39.50和OAI-PMH的不同:

1)Z39.50无需在本地存储资源的元数据信息。

2)从协议的实现复杂程度上来看,OAI-PMH要比Z39.50实现起来容易。

第七章

信息资源的组织方式和方法的特点:

面向用户、面向写作、社会化特征以及面向机器理解。

开放API:

开放API往往以某种Web服务的方式,向外部提供编程接口,通过此接口可以访

问信息集合内的信息资源,并输出XML格式的结果;或者通过接口可以实现一定的功能和服务。

第八章

搜索引擎的分类:

1.从搜索过程的层次看:

①常规搜索引擎。

需爬虫爬取各类网络信息资源并建立索引数据库,搜索过程是对自身索引数据库的搜索过程。

②元搜索引擎。

无需维护索引数据库,是通过检索各个常规搜索引擎,并通过整合各个搜索引擎的结果,提供搜索服务。

2.从索引数据库的信息媒介看:

①图像搜索引擎②视频搜索引擎③网页搜索引擎

3.从搜索引擎所涵盖的信息资源的广度看:

①综合性搜索引擎。

如Baidu,Google等,其索引数据库包括各类信息资源,索引对象为整个WWW的全部网络信息资源。

②专业搜索引擎。

又称垂直搜索引擎,只对WWW的一部分网页进行索引,提供专门的服务。

如论坛搜索。

搜索引擎的发展趋势:

①个性化②智能化③整合化④垂直化⑤移动化⑥开放式

搜索引擎的系统结构:

一个搜索引擎一般由:

搜索器,索引器,索引数据库,检索器和用户接口五个部分组成。

1)搜索器:

定义:

从因特网上采集信息的专用程序,亦称网络机器人,蜘蛛,爬虫等。

功能:

不停地在网上漫游,不断地从网上采集并及时送回相关信息,及时更新搜索引擎的索引数据库。

搜索器要面对的问题【不确定有没有这个知识点,罗琳复习的时候只说系统结构这儿要详细】:

1.WWW庞大的网页数量。

搜索器无法爬取WWW中所有的网页,必须选择最值得爬取的网

页。

2.网页在不断变化。

必须对更新后的网页重复爬取。

3.W

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 职业教育 > 职业技术培训

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2