Dspace系统文档Word格式.docx

上传人:b****5 文档编号:8329703 上传时间:2023-05-11 格式:DOCX 页数:18 大小:29.16KB
下载 相关 举报
Dspace系统文档Word格式.docx_第1页
第1页 / 共18页
Dspace系统文档Word格式.docx_第2页
第2页 / 共18页
Dspace系统文档Word格式.docx_第3页
第3页 / 共18页
Dspace系统文档Word格式.docx_第4页
第4页 / 共18页
Dspace系统文档Word格式.docx_第5页
第5页 / 共18页
Dspace系统文档Word格式.docx_第6页
第6页 / 共18页
Dspace系统文档Word格式.docx_第7页
第7页 / 共18页
Dspace系统文档Word格式.docx_第8页
第8页 / 共18页
Dspace系统文档Word格式.docx_第9页
第9页 / 共18页
Dspace系统文档Word格式.docx_第10页
第10页 / 共18页
Dspace系统文档Word格式.docx_第11页
第11页 / 共18页
Dspace系统文档Word格式.docx_第12页
第12页 / 共18页
Dspace系统文档Word格式.docx_第13页
第13页 / 共18页
Dspace系统文档Word格式.docx_第14页
第14页 / 共18页
Dspace系统文档Word格式.docx_第15页
第15页 / 共18页
Dspace系统文档Word格式.docx_第16页
第16页 / 共18页
Dspace系统文档Word格式.docx_第17页
第17页 / 共18页
Dspace系统文档Word格式.docx_第18页
第18页 / 共18页
亲,该文档总共18页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

Dspace系统文档Word格式.docx

《Dspace系统文档Word格式.docx》由会员分享,可在线阅读,更多相关《Dspace系统文档Word格式.docx(18页珍藏版)》请在冰点文库上搜索。

Dspace系统文档Word格式.docx

Dspace系统中数据组织方式能很好地反映一个组织的结构。

每个Dspace站点被分成假如干个munities,每个munity对应一个实验室、研究中心、或者部门。

munities由Collections组成,这些Collections将相关的容〔数字资产〕分组。

一个Collection可能同时出现在几个不同的munities中。

一个Collection由多个item组成。

2. 

Metadata〔元数据〕

一般来说,Dspace系统支持三种类型的元数据

(1) 

Descriptivemetadata〔描述元数据〕

每一个条目(item)包含一个规的DC元数据记录。

MIT实验室使用的元素和限定词集合是一个Dspace源代码默认的配置。

另外的关于条目〔item〕的描述元数据存在于一系列的Bitstream中。

munities和Collections也包含一些简单的描述元数据,这些元数据存储于DBMS中。

(2) 

AministrativeMetadata〔管理元数据〕

管理元数据包括保存元数据〔preservationmetadata〕、起源数据〔provenance〕以与授权政策数据〔authorizationpolicy〕。

大局部数据于Dspace的关系数据库管理系统模式中。

起源元数据〔provenancemetadata〕存储于DC元数据记录中。

此外,其他的管理元数据被复制到DC元数据记录中以便Dspace系统访问者能够轻松实现数据访问。

(3) 

StructuralMetadata〔结构元数据

结构元数据包含如下信息:

条目〔item〕描述信息、条目部的字节流〔bitstream〕描述信息、条目各组成局部之间的关系信息〔对最终用户而言〕。

例如:

假定一篇论文由假如干TIFF格式的图片构成,每一图片表示论文的一页;

那么,结构元数据将包含如下信息:

每一个图片由一个单独的页面构成;

每个页面或者图片在论文中的位置。

3.Eperson〔电子用户〕

Dspace电子用户的功能:

控制资料提交、系统管理权限等。

Dspace系统中,每个e-person由如下信息构成:

地址、、是否允许用户通过WebUI登陆系统、用户密码、是否是用户自己注册、networkID等。

4.Authorization〔授权〕

Dspace授权系统与EpersonGroup和ResourcePolicy严密联系。

Dspace系统包含两个特殊的组〔Groups〕:

“administrator〞(能对系统进展任何操作)和“anonymous〞(包含所有用户的表列)。

Assigningapolicyforanactiononanobjecttoanonymousmeansgivingeveryonepermissiontodothataction.

对一个对象的一个操作〔action〕指派一个“anonymous〞意味着允许系统的所有用户执行指定操作。

目前,Dspace系统的Collections、munities以与Items都是可以公开浏览的。

仅仅在阅读全文容时受到阅读权限控制。

munity:

ADD/REMOVE 

添加/删除munity中的collections/sub-munitis

Collection:

添加/删除items

DEFAULT_ITEM_READ 

inheritedasREADbyallsubmitteditems

DEFAULT_BITSTREAM_READ 

inheritedasREADbybitstreamsofallsubmitteditems

COLLECTION_ADMIN编辑条目〔edititems〕、删除条目〔withdrawitems〕、mapotheritemsintothiscollection

Item:

添加/删除条目〔items〕

READ 

浏览条目容〔viewitem〕

WRITE修改条目容〔modifyitem〕

BUNDLE:

从Bundle〔包〕中删除字节流〔bitstream〕

BITSTREAM:

浏览Bitstream

WRITE 

修改Bitstream

5.IngestProcessandWorkflow

DSpaceIngestProcess

InprogressInformation:

该类封装了将要导入dspace数据库系统的Item的所有容。

可以通过三种方式将item导入到Dspace系统中;

WebUI接口提交Item

BatchItemImporter批量导入

直接对DspaceDBMSTable进展数据写入。

该方法安全性不好,如果对Dspace系统架构不熟悉的话,不建议使用。

TheItemInstaller:

指派一个访问日期〔AccessionDate〕

把字段“date.available〞的值添加到Item的DC元数据记录中〔DublinCoreMedatadataRecordofItem〕

添加发行日期〔如果元数据记录中没有〕〔issuedate〕

添加provenancemessage〔含bitstreamchecksums〕

添加items到指定的collections,同时添加适宜的授权信息〔authorizationpolicies〕

创建新增items的浏览和检索索引

6.WorkflowSteps〔工作流步骤〕

一个Collection的工作流workflow可以分为三个步骤。

每一个Collection都存在一个相关的e-persongroup来执行相应的步骤。

如果没有e-persongroup与相应的步骤〔step〕对应,那么该步骤将被跳过〔skipped〕。

如果一个Collection的任何步骤都没有与一个e-persongroup相关联,那么Collection的提交信息将被直接载入档案。

换句话说〔Inotherwords〕,workflow的工作顺序如下:

Thecollectionreceivesasubmission.Ifthecollectionhasagroupassignedforworkflowstep1,thatstepisinvoked,andthegroupisnotified.Otherwise,workflowstep1isskipped.Likewise,workflowsteps2and3areperformedifandonlyifthecollectionhasagroupassignedtothosesteps.

SubmissionWorkflowinDspace

7.HANDLES

为存储在Dspace系统中的每一个munity、Collection、Item创建一个永久标识符〔persistentidentifier〕。

Dspace使用RIHandleSystem创建标识符〔identifiers〕。

Dspace主要使用Handles来为每一个数字对象指定一个全球唯一的标识符。

每一个运行Dspace系统的站点需要从RI获取一个HandlePrefix。

一旦用户创建RI指定的HandlePrefix来创建标识符,所创建的标识符就不会和全球其他的标识符产生冲突。

Handles可以用两种方法来书写:

8. 

BITSTEAM‘Persistent’Identifiers

EachbitstreamhasasequenceID,uniquewithinanitem.ThissequenceIDisusedtocreateapersistentID,oftheform:

dspaceurl/bitstream/handle/sequenceID/filename

9.

Dspace系统提供两种方法来存储Bitstreams。

一种是将Bitstreams存储于服务器端的文件系统中;

另一种是使用SRB。

两种方法都通过简单而有效的API来实现。

SRB是用来代替服务器端文件系统或者同服务器文件系统一同使用的不二选择。

无需过多的描述,SRB是一个稳定的〔Robust〕并久经考研的存储管理器〔StorageManager〕,它从根本上提供了从本地或者远程存储系统复制容的无存储限制的直截了当的方法。

10.SearchandBrowse

Dspace允许最终用户使用多种方法发现其存储的数字资源:

Handle:

RI服务器访问

检索一个或多个关键词:

元数据或者全文

索引浏览:

使用Lucene开源软件包对title、date、author进展索引

检索〔Search〕是Dspace系统中重要的资源发现组件。

用户对搜索引擎的要求很挑剔,Dspace搜索组件的目标是为用户提供尽可能多的搜索特性。

Dspace系统的索引和搜索模块由一个简单的API构成,该API可以索引新容、重新生成索引、在全部资源、munity以与Collections上进展搜索。

该API的核心组件是一个开源的Java全文搜索引擎包Lucene。

资源浏览机制是Dspace系统中又一重要的资源发现组件。

浏览子系统也提供了一个有效的API,该API可以指定索引以与索引的局部容。

Dspace系统中,可以通过title、itemissuedate〔条目发布时间〕以与authors〔作者〕的索引来浏览相应的容。

此外,浏览的容还可以限定在特定的munity或者Collection中。

11.HTMLSupport

在极大程度上〔Forthemostpart〕,在不经任何修改的情况下〔as-is〕,目前Dspace系统仅支持简单的Bitstream上传和下载。

这对大多数常规的文件格式〔如:

PDFs、Microsoftworddocuments、spreadsheets等〕来说,是一个很不错的选择。

但是,HTML文档却要复杂得多,涉与到数字保存这里还又许多重要的问题需要解决。

网页由多个文件组成:

一个或者几个相互关联的HTML文件,级连样式表以与图形文件。

网页通常到其他页面,或者包含其他页面的容。

因此,在短期,但用户浏览某个网页时,他同时也需要浏览与该网页相关联的其他网页。

通常,网页都是由网络服务器动态生成的,并且反映相应数据库容的变化。

解决以上问题是大多数文档研究的议题。

目前,Dspace系统处理了这些问题的极小的一局部。

Dspace系统能够存储并且在线浏览自保容的非动态的HTML文档。

12.OAISupport

OAI开发了一个元数据获取协议OAI-PMH,该协议允许程序〔Program〕从一系列数字资源库获取元数据。

这样,用户就可以通过程序从一个地方获取大量的数据资源。

Dspace向外提供条目的DC元数据,同时也通过OAI的’set’机制将Collection公开。

Dspace系统使用OCLC的开放源代码软件OAICat来实现这一功能。

13.openURLSupport

Dspace系统以一种极其〔extremely〕简单的方式支持SFX的openURL协议。

如果拥有一个SFXServer,Dspace系统,通过自动使用DC元数据,将在每一个Item页面上显示一个OpenURL。

此外,Dspace系统还能相应一个引入的〔ining〕OpenURL。

目前,Dspace系统已能通过openURLSupport将openURL部的信息传递到搜索子系统。

14.

15.Subscriptions

16.History

17.ImportandExport

Dspace提供相应的批量处理工具导入和导出items,导出或者用于导入的items都按一定的目录和文件结构存储于文件系统中。

导入导出工具主要有如下几个:

ItemImport、ItemExprot、METSExport等。

18.Registration〔条目注册〕

Registration是一个合并条目〔items〕,条目对应的元数据〔metadata〕以与Bitstreams的〔alternatemeans〕处理方法。

例如:

假定一个仓储系统〔Repository〕中存储大量的数字资产。

与其使用通常的交互式数据获取过程或者批导入命令来处理这些元数据并上传相应的Bitstreams,不如使用regitration方法来注册Dspace的元数据和Bitstream的位置。

Dspace系统使用可以配置参数的导入工具来完成条目注册。

19.Statistics〔统计功能〕

Dspace系统中使用的有关容的各种统计报告是由系统自动生成的。

这些报告是通过分析dspace的log文件而生成的。

统计信息每月清理一次。

统计报告包括如下数据:

Acustomisablegeneralsummaryofactivitiesinthearchive,bydefaultincluding:

Numberofitemviews

Numberofcollectionvisits

Numberofmunityvisits

NumberofOAIRequests

Customisablesummaryofarchivecontents

Broken-downlistofitemviewings

Afullbreak-downofallsystemactivity

Userlogins

Mostpopularsearches

20.ChecksumChecker

验证Dspace数字仓储系统中的容是否被损坏或者篡改。

三、Windows下安装Dspace系统

1.综述:

dspacebeta2版本与postgreSQL8.0兼容,使得在windows下安装dspace变得比以往更加容易。

随着大量的windows批处理文件的出现,Cygwin已经不再必要。

2.安装准备:

(1)jsdk与其以上版本

(2)PostgreSQL8.xwindows版

(4)Jakarta

(5)Dspace软件包(目前最新版本是dspace1.4)

3.安装步骤:

(1)获取以下两个批处理文件dsrun.bat和buildpath.bat,

并置于[dspace-source]/bin下。

复制到[dspace-source]/lib目录下。

(3)确保postgreSQL正在运行,同时运行postGreSQL的pgAdminIII,

作为一个postgre用户连接到数据库。

然后:

创建一个"

loginRole"

(用户)“dspace〞用于供dspace访问;

创建一个UTF-8编码的数据库“dspace〞供dspace所有,

要求所建数据库dspace为UTF8编码格式.

在[dspace-source]\config\dspace.cfg下更新相应的配置。

主要更新容如下:

dspace.dir=[dspace-source]

dspace.url=localhost:

8080/dspace

dspace.hostname=localhost

dspace.name=dspace

config.template.log4j.properties=${dspace.dir}

config.template.log4j-handle-plugin.properties=${dspace.dir}

config.template.oaicat.properties=${dspace.dir}

db.name=postgres

db.url=jdbc:

postgresql:

//localhost:

5432/dspace

db.username=dspace

db.password=dspace

其它配置可不用更改。

注意:

在配置dspace.cfg时,目录一律使用‘/’,而不是“\〞。

否如此编译出错。

例如:

E:

/dspace为正确的目录写法。

(4)运行ant工具,编译dspace工程。

具体过程如下:

将[dspace-source]/bin目录以与[ant]/bin目录参加系统环境变量path中,

然后在命令行模式下运行命令(在[dspace-source]目录下运行):

antfresh_install

运行后该命令后,在[dspace-source]目录下生成一个名为build的文件夹

(5)在[dspace-source]/bin目录下,命令行模式下运行命令:

dsrunorg.dspace

根据提示即可创建管理员。

(6)将(4)生成的[dspace-source]/build目录下的.war文件(dspace.war和dspace-oai.war)复制到

你所安装的tomcat的目录[tomcat]/webapps下面.

(7)启动tomcat服务.

(8)在internet浏览器中输入localhost:

8080/dspace,你将看到dspace主页

4. 

在dspace的安装过程中,要注意先把jdk,ant,以与postgres调试通过,然后再按上述步骤进展安装。

四、Linux下安装Dspace系统〔略〕

有兴趣的朋友可以自己研究。

五、Dspace系统架构Architecture

综述:

Dspace系统系统架构分三层,每一层由假如干组件构成。

存储层〔StorageLayer〕的主要负责元数据和容的物理存储。

业务逻辑层(BussinessLogicLayer)的功能主要是管理文档容、e-people、授权(authorization)以与工作流(workflow)。

应用层(ApplicationLayer)包含Dspace系统和外部世界交互的各种组件。

每一层组件都直接或者间接地调用较低层次的组件。

系统架构的每个层次都对应Dspace源代码中相应的软件包:

存储层:

org.dspace.storage

业务逻辑层:

org.dspace

应用层:

org.dspace.app

DSpaceSystemArchitecture

1. 

StorageLayer(存储层)

RDBMS(关系数据库管理系统)

PostreSQLorOracle

Org.dspace.rdbms

在Dspace.cfg配置文件部配置RDBMS。

BitstreamStore(字节流存储)

Dspace提供两种方法存储容。

其一,服务器端文件系统;

其二,使用SRB。

类BitstreamStoragemanager提供了底层〔数据库层〕访问存储于系统重的Bitstreams。

BusinessLogicLayer(业务逻辑层)

Org.dspace.core

ConfigurationManager(配置管理器)负责读取Dspace系统配置文件dspace.cfg,为其他应用程序(如:

apache)管理’template’配置文件,同时也负责为获取文本信息。

Constants类包含数据库系统中用来表示对象类型(typesofmunity,Collection,Item,Bitstreamandsoon)以与相应动作(action)的常量(constants)定义。

如:

resource_type_id,resource_type_id同时应用于数据表handle和resourcepolicy两个表中。

Context类是Dspace操作的中心类。

任何使用业务逻辑层的API都必须先创建一个Context对象。

这类似于打开数据库的一个连接(Connection)。

当一个Context对象被创建,如下的信息将被自动初始化:

AConnectiontothedatabase;

AcacheofcontentmanagementAPIobjects.Eachtimeacontentobject(SuchasItem,Bitstream)iscreated,itisstoredintheContextObject.

同时,下面的一些信息也将存储于Context对象中:

Thecurrentauthenticateduser,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 人文社科 > 法律资料

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2