基于XML电子公文归档数据结构规范.docx
《基于XML电子公文归档数据结构规范.docx》由会员分享,可在线阅读,更多相关《基于XML电子公文归档数据结构规范.docx(26页珍藏版)》请在冰点文库上搜索。
基于XML电子公文归档数据结构规范
基于XML电子公文归档数据
结构规范(报批稿)
天津市档案局
2006年5月8日
目录
1.范围1
2.规范性引用文件1
3.电子公文归档数据结构描述1
4数据结构组成要素描述4
4.1说明文件4
4.2文件级目录4
4.3归档文件夹4
4.3.1归档文件属性4
4.3.2文件修改或承办信息4
4.3.3草稿、修改稿、审核稿4
4.3.4签发稿5
4.3.5版式公文5
4.3.6元数据5
4.3.7日志文件5
5.各组成要素及其XML描述5
5.1文件级目录5
5.1.1条目信息6
5.2归档文件属性7
5.2.1电子文件特征7
5.3归档文件元数据8
5.3.1标识信息9
5.3.2内容信息9
5.3.3背景信息10
5.3.4结构信息11
5.4日志文件12
附录A 文件级目录数据结构规范模式14
附录B归档文件属性数据结构规范模式15
附录C元数据结构规范模式16
附录D 日志文件数据结构规范模式18
基于XML电子公文归档数据结构规范
1.范围
本规范规定了电子公文归档过程中所需数据文件信息组织方式、存储结构及其基于XML数据体描述的规则和方法等。
本规范适用于电子公文归档信息的生成、存储与交换。
2.规范性引用文件
下列文件中的条款通过本标准的引用而成为本标准的条款。
凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。
凡是不注日期的引用文件,其最新版本适用于本标准。
GB/T18894—2002电子文件归档与管理规范
GB/T18793—2002信息技术可扩展置标语言(XML)1.0
DA/T1—2000档案工作基本术语
DA/T18档案著录规则
DA/T22归档文件整理规则
国家档案局令第6号《电子公文归档管理暂行办法》
W3CXMLSchemaPart0:
PrimerXML模式第0部分:
简介
W3CXMLSchemaPart1:
StructuresXML模式第1部分:
结构
W3CXMLSchemaPart2:
DatatypesXML模式第2部分:
数据类型
W3CextensibleMarkupLanguage(XML)1.0(SecondEdition)可扩展置标语言(XML)1.0(第2版)
W3CNamespaceinXMLXML的名字空间(Namespaces)
3.电子公文归档数据结构描述
为了保证电子文件真实性、完整性、有效性和长期可读性,本标准以归档环节为关键点,收集捕获电子公文形成的内容、背景、结构信息以及公文办理的过程文件等。
将电子公文从形成、办理到归档所形成的不同版本的电子公文及其元数据采用有利于数字档案信息长期保存和可存取的数据结构进行存储与交换。
该结构采用树形结构进行存储,每一存储载体只有一个根目录,一般以“组织机构代码-年度”设置根目录名称,但必须按保管期限相对集中存储。
根目录下可再设文件夹,分别管理不同类型、不同保管期限的电子公文。
具体数据结构如下图所示:
4数据结构组成要素描述
同一年度形成的归档电子公文应保存在同一载体中,每一载体的根目录中应包括说明文件、文件级目录及多个归档文件夹。
一般情况下,文件级目录有多少条,就应有多少个归档文件夹与其对应。
4.1说明文件
文件名称为说明文件.TXT。
用于记录各种有助于说明本年度归档电子公文及载体的信息,包括载体编号、移交单位、文件件数、制作单位、制作人、制作时间、检查人等。
4.2文件级目录
文件名称为文件级目录.XML。
主要指按照一定的次序、体例编排面成的条目组合,一般包括:
全宗号、保管期限代码、年度、归档机构代码、件号、文件标题、责任者、保管期限、文件编号、日期、文种、归档机构、密级、保密期限、页数等著录项目。
4.3归档文件夹
归档文件夹的名称以电子文档号来命名,一件电子公文保存在一个归档文件夹中,用于保存应归档的不同版本的电子公文如草稿、修改稿、审核稿、签发稿、版式公文,以及归档文件属性、归档元数据信息、日志文件等内容。
4.3.1归档文件属性
文件名称为归档文件属性.XML。
用于描述一件归档电子公文所有信息的电子特征,如一条记录带有不同稿本如签发稿、正式公文、拟稿单或承办单,那么此文件中应有三条记录,每条记录应包括:
过程文件、文件格式、文件大小、页数等信息。
4.3.2文件修改或承办信息
指公文流转过程或签批过程的信息。
一份归档电子公文如是发文应带有拟稿单,如是收文应带有承办单,拟稿单和承办单必须归档、保留。
其格式允许使用XML、PDF、CEB、SEP、TIFF、JPEG、TXT、RTF、DOC、WPS等。
4.3.3草稿、修改稿、审核稿
主要指公文办理过程中产生的不同版本。
可根据具体情况进行取舍,对于重要公文要保留历次的修改稿,一般情况下不保留。
版本的格式允许使用XML、PDF、CEB、SEP、TIFF、JPEG、TXT、RTF、DOC、WPS等。
4.3.4签发稿
指发文机关领导人对公文进行最后审定、签署的稿本。
一般情况下必须保留。
其格式允许使用XML、PDF、CEB、SEP、TIFF、JPEG、TXT、RTF、DOC、WPS等。
4.3.5版式公文
指正式的电子公文,一般情况下必须保留。
其格式允许使用XML、PDF、CEB、SEP、TIFF、JPEG、TXT、RTF、DOC、WPS等。
4.3.6元数据
文件名称为元数据.XML。
主要用于记录每一份电子公文的必备和可选元数据信息。
其中必备元数据包括电子文档号、文件标题、责任者、保管期限、文件编号、日期、文种、签发人、归档机构、密级、保密期限、过程文件、文件格式、文件大小、页数。
可选元数据包括分类号、主题词或关键词、内容描述、附件信息、归档时间、主送者、抄送者、语种、行文依据、相关信息、电子公文类别代码、信息系统描述、操作环境描述,阅读软件描述、数字签名描述等。
4.3.7日志文件
文件名为日志文件.XML。
主要用于记录每一份电子公文从生成、办理直至归档过程中所作的任何操作,如谁起草的公文,谁对公文进行了改动等信息,每一份公文的任何改动都应记录在日志文件文件中,通过日志文件可以反应出该份公文的操作过程。
5.各组成要素及其XML描述
5.1文件级目录
XML标记:
文件级目录。
值域:
不作要求。
Schema定义:
见表1。
元素:
文件级目录表1
层次
模型
注释
源
代
码
elementname="文件级目录">
complexType>
sequencemaxOccurs="unbounded">
elementref="条目信息"/>
sequence>
complexType>
element>
5.1.1条目信息
XML标记:
条目信息。
值域:
不作要求。
Schema定义:
见表2。
元素:
条目信息表2
层次
模型
注释
源代码
elementname="条目信息"maxOccurs="unbounded">
complexType>
sequence>
elementname="全宗号"type="xs:
string"/>
elementname="保管期限代码"type="xs:
string"/>
elementname="年度"type="xs:
string"/>
elementname="归档机构代码"type="xs:
string"/>
elementname="件号"type="xs:
string"/>
elementname="文件标题"type="xs:
string"/>
elementname="责任者"type="xs:
string"/>
elementname="保管期限"type="xs:
string"/>
elementname="文件编号"type="xs:
string"/>
elementname="日期"type="xs:
string"/>
elementname="文种"type="xs:
string"/>
elementname="归档机构"type="xs:
string"/>
elementname="密级"type="xs:
string"/>
elementname="保密期限"type="xs:
string"/>
elementname="页数"type="xs:
string"/>
sequence>
complexType>
element>
5.2归档文件属性
XML标记:
归档文件属性。
值域:
不作要求。
Schema定义:
见表3。
元素:
归档文件属性表3
层次
模型
注释
源
代
码
elementname="归档文件属性">
complexType>
sequenceminOccurs="0"maxOccurs="unbounded">
elementref="电子文件特征"/>
sequence>
complexType>
element>
5.2.1电子文件特征
XML标记:
电子文件特征。
值域:
不作要求。
Schema定义:
见表4。
元素:
电子文件特征表4
层次
模型
注释
源代码
elementname="电子文件特征">
complexType>
sequence>
elementname="过程文件"type="xs:
string"/>
elementname="文件格式"type="xs:
string"/>
elementname="文件大小"type="xs:
string"/>
elementname="页数"type="xs:
string"/>
sequence>
complexType>
element>
5.3归档文件元数据
XML标记:
元数据。
值域:
不作要求。
Schema定义:
见表5。
元素:
元数据表5
层次
模型
注释
电子公文归档数据结构
源
代
码
elementname="元数据">
annotation>
documentation>
电子公文归档数据结构
documentation>
annotation>
complexType>
sequence>
elementref="标识信息"/>
elementref="内容信息"/>
elementref="背景信息"/>
elementref="结构信息"/>
sequence>
complexType>
element>
5.3.1标识信息
XML标记:
标识信息。
值域:
不作要求。
Schema定义:
见表6。
元素:
标识信息表6
层次
模型
注释
源
代
码
elementname="标识信息">
complexType>
sequence>
elementname="电子文档号"type="xs:
string"/>
elementname="分类号"type="xs:
string"minOccurs="0"/>
sequence>
complexType>
element>
5.3.2内容信息
XML标记:
内容信息。
值域:
不作要求。
Schema定义:
见表7。
元素:
内容信息表7
层次
模型
注释
源
代
码
elementname="内容信息">
complexType>
sequence>
elementname="文件标题"type="xs:
string"/>
elementname="文件编号"type="xs:
string"/>
elementname="页数"type="xs:
string"/>
elementname="文种"type="xs:
string"/>
elementname="主题词"type="xs:
string"minOccurs="0"/>
elementname="内容描述"type="xs:
string"minOccurs="0"/>
elementname="附件信息"type="xs:
string"minOccurs="0"/>
sequence>
complexType>
element>
5.3.3背景信息
XML标记:
背景信息。
值域:
不作要求。
Schema定义:
见表8。
元素:
背景信息表8
层次
模型
注释
源
代
码
elementname="背景信息">
complexType>
sequence>
elementname="责任者"type="xs:
string"/>
elementname="保管期限"type="xs:
string"/>
elementname="签发人"type="xs:
string"/>
elementname="日期"type="xs:
string"/>
elementname="归档机构"type="xs:
string"/>
elementname="密级"type="xs:
string"/>
elementname="保密期限"type="xs:
string"/>
elementname="归档时间"type="xs:
string"minOccurs="0"/>
elementname="行文依据"type="xs:
string"minOccurs="0"/>
elementname="相关信息"type="xs:
string"minOccurs="0"/>
elementname="语种"type="xs:
string"minOccurs="0"/>
elementname="主送者"type="xs:
string"minOccurs="0"/>
elementname="抄送者"type="xs:
string"minOccurs="0"/>
sequence>
complexType>
element>
5.3.4结构信息
XML标记:
结构信息。
值域:
不作要求。
Schema定义:
见表9。
元素:
结构信息表9
层次
模型
注释
源
代
码
elementname="结构信息">
complexType>
sequence>
elementname="过程文件"type="xs:
string"/>
elementname="文件格式"type="xs:
string"/>
elementname="文件大小"type="xs:
string"/>
elementname="电子公文类别代码"type="xs:
string"/minOccurs="0">
elementname="信息系统描述"type="xs:
string"minOccurs="0"/>
elementname="操作环境描述"type="xs:
string"minOccurs="0"/>
elementname="阅读软件描述"type="xs:
string"minOccurs="0"/>
elementname="数字签名描述"type="xs:
string"minOccurs="0"/>
sequence>
complexType>
element>
5.4日志文件
XML标记:
日志文件。
值域:
不作要求。
Schema定义:
见表10。
元素:
日志文件表10
层次
模型
注释
源
代
码
elementname="日志文件">
complexType>
sequencemaxOccurs="unbounded">
elementname="操作日志">
complexType>
sequence>
elementname="操作者"type="xs:
string"/>
elementname="操作时间"type="xs:
dateTime"/>
elementname="操作行为"type="xs:
string"/>
elementname="操作内容"type="xs:
string"minOccurs="0"/>
elementname="版本标记"type="xs:
string"minOccurs="0"/>
elementname="文件名"type="xs:
string"minOccurs="0"/>
elementname="公文流转结点"type="xs:
string"minOccurs="0"/>
sequence>
complexType>
element>
sequence>
complexType>
element>
附录A 文件级目录数据结构规范模式
xmlversion="1.0"encoding="UTF-8"?
>
schemaxmlns="xmlns:
xs="http:
//www.w3.org/2001/XMLSchema"targetNamespace="elementFormDefault="qualified"attributeFormDefault="unqualified">
elementname="文件级目录">
complexType>
sequence>
elementname="条目信息"maxOccurs="unbounded">
complexType>
sequence>
elementname="全宗号"type="xs:
string"/>
elementname="保管期限代码"type="xs:
string"/>
elementname="年度"/>"type="xs:
string"/>
elementname="归档机构代码"/>"type="xs:
string"/>
elementname="件号"type="xs:
string"/>
elementname="文件标题"type="xs:
string"/>
elementname="责任者"type="xs:
string"/>
elementname="保管期限"/>"type="xs:
string"/>
elementname="文件编号"type="xs:
string"/>
elementname="日期"type="xs:
string"/>
elementname="文种"type="xs:
string"/>
elementname="归档机构"type="xs:
string"/>
elementname="密级"type="xs:
string"/>
elementname="保密期限"type="xs:
string"/>
elementname="页数"type="xs:
string"/>
sequence>
complexType>
element>
sequence>
complexType>
element>
schema>
附录B归档文件属性数据结构规范模式
xmlversion="1.0"encoding="UTF-8"?
>
schemaxmlns="xmlns:
xs="http:
//www.w3.org/2001/XMLSchema"targetNamespace="elementFormDefault="qualified"attributeFormDefault="unqualified">
elementname="归档文件属性">
compl