地质信息元数据标准Word文件下载.docx
《地质信息元数据标准Word文件下载.docx》由会员分享,可在线阅读,更多相关《地质信息元数据标准Word文件下载.docx(115页珍藏版)》请在冰点文库上搜索。
上述标准中均未定义的代码则由本标准新增加。
代码表主要有如下变更:
MD_表示类型代码表(MD_RepresentationTypeCode)中的文本/表数据项分解为文本、数据表两个数据代码;
MD_关键词类型代码表(MD_KeywordTypeCode)中删除了容易引起混淆的“沉积岩(stratum)”的代码;
MD_维护频率代码表(MD_MaintenanceFrequencyCode)中增加“每5天”代码;
MD_字符集代码(MD_CharacterSetCode)表增加了GBK和HZ两个代码。
MD_安全限制分级代码(MD_ClassificationCode)表中增加了未分级代码;
MD_介质名称代码(MD_MediumNameCode)中删除5”软盘数据项,增加了硬盘、U盘、电子邮件、可擦写光盘和其它数据项。
本标准的附录A为规范性附录,附录B、C为资料性附录。
本标准由中国地质调查局提出。
本标准由中国地质调查局归口。
本标准的起草单位:
中国地质调查局发展研究中心。
本标准主要起草人:
张明华、胡雄伟、陈春仔、姜作勤。
11 范围
本标准定义了描述地质信息所需要的元数据的内容和结构。
它提供描述地质信息的标识、质量、内容、空间参照系、分发等信息。
本标准适用于各类以空间数据为主的地质数据集以及非空间信息数据集的描述、数据集信息的发布以及网络交换。
元数据的采集和建库也可参考本标准。
12 一致性
12.1 一致性要求
任何声明与本标准一致的元数据应当满足本标准的完整元数据定义(第六章和附录A),并满足一致性测试条件。
任何声明和本标准一致的专用标准应当从本标准中选择产生,并满足一致性测试条件。
任何声明和本标准一致的带有扩展的专用标准应当满足本标准的扩展方法和原则,并通过一致性测试。
13 规范性引用文件
下列文件中的条款通过本标准的引用而成为本标准的条款。
凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。
凡是不注日期的引用文件,其最新版本适用于本标准。
GB/TXXXX-200X地理信息元数据(报批稿)
GB/T4880-1991语种名称代码
GB7156-1987文献保密等级代码
GB/T7408-1994数据元和交换格式信息交换日期和时间表示法
TD/T1016-2003国土资源核心信息元数据标准2003
ISO19115:
2003(E)Geographicinformation-Metadata
ISO19113:
2002Geographicinformation–Qualityprinciples
IETFRFC1738UniformResourceLocators
IETFRFC2056UniformResourceLocatorsforZ39.50
14 术语和定义
本标准采用下列术语和定义。
[本标准的术语和定义主要引自国标]
14.1 数据集dataset
可以标识的数据集合。
注:
数据集可以是数据库,也可以是数据库的一部分。
14.2 数据集系列datasetseries
采用相同规范的若干数据集的集合。
14.3 元数据metadata
关于数据的数据,是描述数据的内容、覆盖范围、质量、现状、管理方式、数据的所有者、数据的提供方式等有关的信息。
14.4 元数据元素metadataelement
元数据的基本单元。
与UML术语中的属性同义。
14.5 元数据实体metadataentity
一组说明数据同类特征的元数据元素的集合。
元数据实体可以是单个实体,也可以是包括一个或多个实体的聚合实体。
与UML术语中的类同义。
14.6 元数据子集metadatasection
相互关联的元数据实体和元素的集合。
与UML术语中的包同义。
14.7 数据质量dataquality
有关数据满足规定和隐含需求能力的总体特征。
[引自GB/T19000]
14.8 数据志lineage
从数据源到数据集当前状态的演变过程的说明,包括获取或生产数据使用的数据源(原始资料)的说明、数据处理过程中的事件、参数、步骤的情况以及负责单位的有关信息等。
15 符号和缩略语
15.1 缩略语
DTD文档类型定义(DocumentTypeDefinition)
UML统一建模语言(UnifiedModellingLanguage)
XML可扩展置标语言(ExtensibleMarkupLanguage)
15.2 统一建模语言(UML)符号
本标准用UML静态结构图表示元数据结构。
图1说明本标准使用的UML符号:
图1 UML符号
15.3 UML模型关系
15.3.1 关联
关联用于描述两个或更多类之间的关系。
UML定义了三种不同类型关系:
关联、聚合和组合。
关联用于表示两个类之间的一般关系。
聚合关联和组合关联用于创建两个类之间的部分与整体关系。
关联的方向用在线段终点的箭头标记,指明方向的关联称为单向关联,如果不指明方向,则认为是双向关联。
在聚合关联表示的两个类之间的关系中,一个类担当容器角色,另一个类担当容器的构件角色。
组合关联是强聚合关系。
如果删除一个容器对象,则它的所有容器构件也被删除。
当没有容器对象,表示容器对象局部的对象就不可能存在时,应当使用组合关联。
15.3.2 泛化
泛化表示超类与可以替代它的子类之间的关系。
超类是泛化类,而子类则为特化类。
子类继承超类的所有属性和行为,并且可以扩展。
15.3.3 角色
角色表示类在关联中的作用。
如果一个关联中只有一个特定的方向,就用一个角色名称表示相应的源和目标的关系。
在双向关联中,将提供两个角色名称。
图2说明在UML图中如何表示角色名称和基数。
图2 UML角色
15.4 UML模型构造型
UML构造型是现有UML概念的扩展,是在已定义的UML模型元素的基础上构造一种新的模型元素
的机制。
以下是本标准使用的构造型的简单说明。
本标准中使用如下构造型:
a)<
<
类型>
>
(<
Type>
)是一种类,用于规定对象的域及对对象的操作。
类型可以有属性和关联。
b)<
枚举>
(<
Enumeration>
)一种数据类型,其实例构成具明确定义的字符值列表。
枚举的名称与它的字符值都应予以说明。
枚举的意思是一个类中所有可能取值的简短列表。
c)<
数据类型>
DataType>
)一组需要一致,其操作没有副作用的值的描述符。
数据类型包括原来定义的类型和用户定义类型。
原来定义的数据类型包括数字、字符串和时间。
用户定义的数据类型包括枚举。
本标准中,元数据实体(或子集)以及代码表也作为一种的特殊的实体数据使用,其数据类型称为类。
d)<
代码表>
CodeList>
)用于描述更开放的枚举类。
是一个灵活的枚举。
代码表通常用于表示可能取值的长列表。
如果表的元素完全是已知的,应当使用枚举;
如果只有元素的可能值是已知的,则应使用代码表。
e)<
包>
Package>
)逻辑上相关的组成部分的聚合,可包含子包。
15.5 UML模型和元数据数据字典的关系
表1说明UML模型术语和数据字典术语之间的关系。
表1 UML模型和数据字典关系
UML模型术语
数据字典术语
包
子集
泛化类
实体
特化类
类
属性
元素
关联
16 元数据结构与内容
本标准采用UML类图和元数据数据字典相结合的方法描述地质信息元数据。
在元数据结构上采用《国土资源核心信息元数据标准》的结构作为本标准的基本结构,在内容上通过数据字典和代码表对元数据的特征(子集/实体名、元素名、英文名、英文缩写、定义、约束/条件、出现次数、类型和值域)进行详细描述。
16.1 元数据概念结构
图3描述了地质信息元数据的概念结构。
每个元数据包包含一个或多个实体以及元数据元素,
图3
地质信息元数据概念结构图
地质信息元数据由7个元数据子集(UML包)(表2)构成,元数据信息、标识信息、数据质量信息、内容信息是必选子集,空间参照信息、分发信息、引用和负责单位联系信息是可选子集。
引用和负责单位联系信息是公用信息子集。
表2 地质信息元数据元数据包和元数据实体对比表
序号
包/子集名
UML图
数据字典
定义
元数据信息
MD_元数据
图4
表3
包含元数据的全部信息
2
标识信息
MD_标识
图5
表4
描述地质数据集的基本信息
3
数据质量信息
DQ_数据质量
图6
表5
提供数据集数据质量总体评价信息
4
空间参照系信息
RS_参照系
图7
表6
数据集使用的空间参照系的说明
5
内容信息
MD_内容描述
图8
表7
描述数据集的内容信息
6
分发信息
MD_分发
图9
表8
描述数据集分发者和获取数据的方法
7
引用和负责单位联系信息
CI_引用
CI_负责单位
图10
表9
提供引用资料名称、日期以及负责单位名称、职责、联系等信息
每个子集由若干个实体(UML类)和元素(UML类属性)构成。
可重复使用实体(负责单位信息实体、引用信息实体)由其他子集调用,不单独使用。
16.2 元数据内容
16.2.1 元数据信息
元数据信息实体描述地质信息的全部元数据信息,用必选实体MD_元数据(MD_Metadata)表示。
元数据实体由以下元数据实体和元数据元素构成:
必选实体
MD_标识(MD_Identification)
DQ_数据质量(DQ_DataQuality)
MD_内容描述(MD_ContentDescription)
条件必选实体
RS_参照系(RS_ReferenceSystem)
可选实体
MD_分发(MD_Distribution)
必选元素
元数据创建日期
联系单位
可选元素
元数据名称
字符集
语种
元数据标准名称
元数据标准版本
MD_元数据实体的UML类图见图4。
图4 元数据信息
16.2.1.1
标识信息是地质数据集的基本信息,用MD_标识(MD_Identification)实体表示,是必选实体。
MD_标识是下列实体的聚合:
必选实体:
MD_关键词(MD_Keywords)
MD_数据集限制(MD_Constraints)
MD_数据集格式(MD_Format)
EX_时间范围信息(EX_TemporalExtent)
EX_地理坐标范围信息(EX_GeographicBoundaryBox)
EX_垂向范围信息(EX_VerticalExtent)
EX_静态浏览图信息(MD_BrowseGraphic)
CI_维护信息(MD_MaintenanceInformation)
MD_标识实体本身包含如下元素:
必选元素:
引用
摘要
状况
数据表示方式
专题类别
联系信息
条件必选元素
影像轨道标识
地理标识符
目的
空间分辨率
MD_标识实体的UML类图见图5。
图5 标识信息
16.2.1.2 数据集质量信息
数据集质量信息是数据集质量的总体评价,用DQ_数据质量(DQ_DataQuality)实体表示。
DQ_数据质量实体包括两个条件必选的实体,DQ_数据质量说明(DQ_Description)和DQ_数据志(DQ_Lineage)。
DQ_数据质量说明是数据集的总体质量信息,包含6个元素,其中验收说明是必选元素、图件输出质量和附件质量是条件必选元素,其余为可选元素。
数据志(DQ_数据志)是从数据源到数据集当前状态的演变过程说明。
包括数据源信息实体(LI_数据源,LI_Source)和处理过程信息实体(LI_处理过程,LI_ProcessStep)。
LI_数据源信息包括数据源说明、数据源比例尺分母、数据源参照系和数据源引用元素。
LI_处理过程实体包括处理步骤说明。
DQ_数据质量实体的UML类图见图6。
图6 数据集质量信息
16.2.1.3 空间参照系信息
空间参照系信息是数据集使用的空间参照系的说明,是条件必选子集,用RS_参照系(RS_ReferenceSystem)实体表示。
RS_参照系由三个条件必选的实体构成:
SI_基于地理标识的空间参照系(SI_SpatialReferenceSystemUsingGeographicIdentifiers)
SC_基于坐标的空间参照系(SC_CRS)
SC_垂向坐标参照系(SC_VerticalReferenceSystem)
RS_参照系实体的UML类图见图7。
图7 空间参照系
16.2.1.4 内容信息
内容信息描述数据集数据的内容信息,用MD_内容描述(MD_ContentDescription)实体表示。
MD_内容描述实体包括两个条件必选元素图层名称和栅格/影像内容描述,两个必选元素,要素(实体)类型名称和属性列表,一个可选元素属性结构描述文件。
MD_内容描述实体的UML类图见图8。
图8 内容信息
16.2.1.5 分发信息
分发信息描述有关数据集的分发者和获取数据的方法,用MD_分发(MD_Distribution)实体表示。
MD_分发实体包含分发联系方、订购说明和在线信息元素,和MD_分发介质实体(MD_Medium)。
MD_分发实体的UML类图见图9。
图9 分发信息
16.2.1.6 引用和负责单位联系信息
引用信息和负责单位联系信息属于数据类型,是可以重复使用的公用信息实体,不单独使用。
引用信息用CI_引用实体(CI_Ciation)表示。
负责单位联系信息实体用CI_负责单位(CI_ResponsibleParty)表示,包含了CI_联系(CI_Contact)实体(表10)。
CI_引用实体和CI_负责单位实体的UML类图见图10。
图10 引用和负责单位联系信息
16.3 数据字典
表3-10提供了描述地质信息元数据实体和元素的详细定义的数据字典,它与本章6.2节的UML模型以及附录A的元数据代码表一起构成地质信息元数据的完整定义。
字典中有阴影的行表示元数据实体。
代码表在附录A中定义。
元数据实体和元数据元素用七个属性定义,其说明如下:
16.3.1 名称/角色名称
名称是元数据实体或元数据元素的唯一标记。
角色名称用于标识关联。
实体名称在整个字典中是唯一的,元数据元素名称在所在的实体中是唯一的。
实体名称的构成:
英文名称的定义方法与国际惯例保持一致,由实体的缩写开头,紧跟“_”连接符,后面是相应类的英文名称构成。
如果实体英文名称是单个单词,则首字母大写,如MD_Metadata;
如果英文名称是由多个单词组成,单词中间不留空格,且每个单词的首字母都要大写,如DQ_DataQuality。
中文名称的构成与英文名称相对应,例如MD_元数据、DQ_数据质量。
元素名称的构成:
中文名称无特别规定。
英文名称保持与ISO19115标准一致。
元素的英文名称首字母小写,如果名称由多个单词组成,则单词之间无空格,除第一个单词外,其余单词的首字母大写,如contact、dataQuality。
16.3.2 缩写名
除代码表外,每一个元数据元素都有一个在整个标准中唯一的缩写名。
16.3.3 定义
对元数据实体或元数据元素确切含义的描述。
16.3.4 约束/条件
元数据实体或元数据元素的选择条件的描述符,有如下的值:
M(必选)、C(条件必选)、O(可选)。
16.3.4.1 必选(M)
必须包括的元数据实体或元素。
可选实体中可以有必选元素,这些元素只有当可选实体被选择时才成为必选元素。
16.3.4.2 条件必选(C)
说明元数据实体或元素是否选用的条件。
当该条件满足时,其实体或元素成为必选实体或元素。
16.3.4.3 可选(O)
元数据实体或元素可以选用,也可以不选用。
当一个可选实体未被选用时,其包含的所有元素也不选用。
16.3.5 最大出现次数
元数据实体或元素可能重复出现的最大次数。
“1”表示出现1次,“N”表示可以重复出现。
16.3.6 数据类型
说明元数据元素的一组不同的值。
可以是基本数据类型,也可以是被称作为“类”的实体、构造型或关联。
16.3.7 域
对于元数据数实体而言,域是该元数据实体包含的序号(数据字典中表的层次序列号)范围;
角色名称的域是指与之关联的实体名称。
对于元数据元素而言,域是该元素的允许的取值范围、或实体名、或代码表名、或数据类型名称、或使用自由文本。
表3 元数据信息(MD_元数据)
子集/实体名
元素名/角色名
英文名
英文缩写
约束/条件
出现次数
类型
值域
1.1
MD_Metadata
Metadata
定义有关数据集或数据资源的元数据的根实体
M
1.1.1-1.1.11
1.1.1
metadataTitle
mdTitle
元数据的名称
O
字符串
自由文本
1.1.2
dataStamp
mdDataSt
元数据的审定日期
日期
CCYYMMD(GB/T7408-1994)
1.1.3
language
mdLang
元数据使用语言
N
“汉语”,“英语”,自由文本
1.1.4
characterSet
mdChar
元数据采用的字符编码标准
MD_字符集代码(代码表)A.1
1.1.5
metadataStandardName
mdStanName
执行的元数据标准名称
1.1.6
metadataStandardVersion
mdStanVer
执行的元数据标准版本号
1.1.7
contact
mdContact
对元数据信息负责任的单位或个人
1.1.8
角色名:
标识信息
identificationInfo
dataIdInfo
1.1.9
数据质量信息
da