信息技术信息分类编码的基本原则和方法国家地震科学数据共享中心.docx
《信息技术信息分类编码的基本原则和方法国家地震科学数据共享中心.docx》由会员分享,可在线阅读,更多相关《信息技术信息分类编码的基本原则和方法国家地震科学数据共享中心.docx(100页珍藏版)》请在冰点文库上搜索。
信息技术信息分类编码的基本原则和方法国家地震科学数据共享中心
XXDB
地震科学数据共享工程技术标准
EDS/Tx—2006
XXXXXX
中国地震局发布
200×-××-××实施
200×-××-××发布
目次
前言II
1范围3
2规范性引用文件3
3术语和定义3
4数据元表达格式4
5数据元值的表示方法4
5.1数据类型表示法4
5.2字符长度表示法5
5.3应用示例5
6数据元分组5
6.1数据元分组方案5
6.2数据元标记的分配6
7数据元目录6
7.1地震科学数据公共数据元6
7.2地震观测数据元9
7.3地震探测数据元33
7.4地震调查与考察数据元39
7.5地震实验与试验数据元53
7.6防震减灾综合数据元目录55
前言
本标准是<<地震科学数据>>系列标准的第四项标准,该系列标准的预计结构为:
----地震科学数据元数据编写指南;
----地震科学数据数据模式编写指南;
----地震科学数据数据库建库指南;
----地震科学数据数据元目录.
—地震科学数据数据交换格式
—地震科学数据数据分类与编码
本标准为第一次制定。
本标准主要起草单位:
中国地震台网中心,中国地震局地球物理研究所。
本标准主要起草人:
吴敏赵宇彤赵仲和杨辉顾左文周克昌黄志斌代光辉纪寿文冯义钧田丰
地震科学数据数据元目录
11 范围
本标准规定了地震科学数据共享工程中涉及的地震数据元的内容及其表达。
本标准适用于地震科学数据共享工程中的数据资源生产、数据集建库、数据信息交换与共享。
12 规范性引用文件
下列文件中的条款通过本标准的引用而成为本标准的条款。
凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准。
凡是不注日期的引用文件,其最新版本适用于本标准。
GB/T2260中华人民共和国行政区划代码
GB2312信息交换用自由文本编码字符集基本集
GB/T2659世界各国和地区名称代码(eqvISO3166-1)
GB/T4880.2—2000语种名称代码第2部分:
字母代码
GB/T7408数据元交换格式信息交换日期和时间表示法(eqvISO8601)
GB/T18391信息技术数据元的规范与标准化(idtISO/IEC11179)
GB/T19253信息技术数据元值的格式表示法
GB/T18207.1-2000防震减灾术语第一部分:
基本术语
GB/T18207.2-2005防震减灾术语第2部分:
专业术语
DB/T2-2003地震波形数据交换格式
DB/T3-2003地震及地震前兆测项分类与代码
DB/T4-2003地震台站代码
DB/T11.1-2006《地震数据分类与代码第1部分:
基本类别》(送审稿)
13 术语和定义
本标准采用下列术语和定义。
13.1
数据data
对事实、概念或指令的一种形式化表示,适用于以人工或自动方式进行通信、解释或处理。
[GB/T18391.1-2002]
13.2
数据元dataelement
数据元素dataelement
用一组属性描述定义、标识、表达和允许值的数据单元。
[GB/T18391.1-2002]
注:
数据元也是构建元数据和元数据实体的基本单元。
13.3
数据元目录dataelementdirectory
数据元字典dataelementdirectory
列出并定义了全部相关数据元的一种信息资源。
注:
数据元目录可有不同层级,例如,ISO/IEC委员会级、国际协会级、行业部门级、公司级、应用系统级。
13.4
数据元值dataelementvalue
数据元允许值集合中的一个值。
13.5
数据元值的长度dataelementvaluelength
数据元值中字符的数目。
注:
按ASCII字符数目计算数据元值的长度,一个汉字相当于2个字符。
13.6
数据集dataset
可以标识的数据集合。
注:
数据集可以是一个数据库或一个或多个数据文件。
14 数据元表达格式
本标准中,数据元是通过标记、名称、英文名称、缩略表达、定义、同义名称、表示、计量单位、语境、值域、版本这些属性来表达的,其中缩略表达、计量单位、同义名称和语境是可以根据需要选用的可选项。
(1)标记:
在数据元目录中,为数据元分配的与语言无关的惟一标识。
(2)名称:
数据元的中文名称,是标识数据元的主要手段。
(3)英文名称:
数据元的英文全称。
(4)缩略表达:
数据元的英文简称。
(可选)
(5)定义:
关于数据元的含义和基本特性的说明,并使之区别于其他数据元。
(6)同义名称:
本数据元的其他许用名称。
(可选)
(7)表示:
数据元值的数据类型及字符长度的组合表示格式。
参见5。
(8)计量单位:
数值型数据元值的计量单位。
(可选)
(9)语境:
产生或使用数据元的应用环境的说明。
(可选)
(10)值域:
数据元取值范围或相关内容的说明。
如所采用的代码标准,或通过枚举等方式给出所有可能的取值。
(11)版本:
数据元所在数据元目录的版本标识。
15 数据元值的表示方法
本标准中,数据元值基本采用GB/T19253规定的数据元值的数据类型与字符长度表示方法,根据需要做了少量修改和补充。
15.1 数据类型表示法
本标准数据元值的数据类型采用表1所示的方法表示。
表1数据类型表示法
表示符
数据类型
说明
S
字符型
可以包含自由文本(中、国……等)、字母字符(a-z,A-Z)、数字字符等。
(默认GB2312信息交换用自由文本编码字符集基本集)
B
逻辑型
用0(False)或1(True)形式表示的逻辑值。
N
数值型
数字形式表示的数值。
T
日期时间型
采用GB/T7408中规定的YYYYMMDD或YYYYMMDDThhmmss格式
BY
二进制流
图像、音频、视频等二进制流文件格式。
15.2 字符长度表示法
本标准数据元值的字符长度采用表2所示的方法表示。
表2字符长度表示法
分类
表示方法
固定长度
在数据类型表示符后直接给出字符长度的数目。
可变长度
1)可变长度不超过定义的最大字符数
在数据类型表示符后加“..”后给出数据元最大字符数目。
2)可变长度在定义的最小和最大字符数之间
在数据类型表示符后给出最小字符长度数后加“..”后,再给出最大字符数。
有若干字符行表示的长度
按固定长度或可变长度的规定给出每行的字符长度数后加“X”后,再给出最大行数。
15.3 应用示例
(1)S字符型
S12固定长度为12个字符(相当于6个自由文本)长度的字符。
S..12可变长度,最大为12个字符长度的字符。
S4..12可变长度,最小为4个字符,最大为12个字符长度的字符。
S..40X3每行最大长度为40个字符长度的3行字符。
(2)B逻辑型(布尔型)
B(0)或B(F)表示取值为假。
B
(1)或B(T)表示取值为真。
(3)N数值型
N3固定长度为3位数字。
N..3最大长度为3位数字。
N9,2最大长度为9位的十进制小数格式(包括小数点),小数点后保留2位数字。
(4)T日期时间型
T8采用YYYYMMDD格式(8位定长)表示年月日。
如1998年1月8日,应表示为19980108。
T15采用YYYYMMDDThhmmss格式(15位定长)表示年月日时分秒。
时分秒之前加大写字母“T”。
如2004年3月25日9时8分5秒为20040325T090805。
(5)BY二进制流(BY后加具体的媒体格式表示)
BY-JPEG表示该数据是一个JPEG格式文件。
16 数据元分组
16.1 数据元分组方案
根据DB/T11.1-2006,将数据元按其所属数据类别分为以下6组:
第1组地震科学数据公共数据元;
第2组地震观测数据元;
第3组地震探测数据元;
第4组地震调查(考察)数据元;
第5组地震实验与试验数据元;
第6组防震减灾综合数据元;
16.2 数据元标记的分配
本标准中采用4位数字作为数据元标记。
其中,第1位数字为数据元所属的组号,后3位为流水号。
17 数据元目录
17.1 地震科学数据公共数据元
1001地震名称EarthquakeName
说明:
对特定地震给出的名称,通常以发震日期和地点命名。
如“1976年唐山大地震”,“1975年海城大地震”,“1906年旧金山大地震”等。
表示:
S..30
值域:
自由文本。
版本号:
V1.0
1002发震日期OriginDate
说明:
地震的发生日期。
表示:
T8
值域:
采用GB/T7408中的YYYYMMDD格式表示。
版本号:
V1.0
1003发震时刻OriginTime
说明:
地震波开始传播的时刻。
(GB/T18207.2-2005<防震减灾术语:
专业术语>)
表示:
T15
值域:
采用GB/T7408中的YYYYMMDDThhmmss格式表示。
版本号:
V1.0
1004震中纬度EpicentralLatitude
说明:
震中的地理纬度。
北纬用正值表示,南纬用负值表示。
表示:
N7,3
值域:
数值型.
版本号:
V1.0
1005震中经度EpicentralLongitude
说明:
震中的地理经度。
东经用正值表示,西经用负值表示。
表示:
N8,3
值域:
数值型.
版本号:
V1.0
1006震源深度FocalDepth
说明:
震源与震中的距离。
(GB/T18207.2-2005<防震减灾术语:
专业术语>)
表示:
N7,3
值域:
数值型
版本号:
V1.0
1007震级Magnitude
说明:
对地震大小的相对量度。
(GB/T18207.1-2000<防震减灾术语:
基本术语>)
表示:
S2
值域:
英文字母
版本号:
V1.0
1008震源距HipocentralDistance
说明:
地震震源至某一指定点的距离。
(GB/T18207.1-2000<防震减灾术语:
基本术语>)
表示:
N7,3
值域:
数值型
版本号:
V1.0
1009震中距EpicentralDistance
说明:
地震震中至某一指定点的地面距离。
(GB/T18207.1-2000<防震减灾术语:
基本术语>)
表示:
N7,3
值域:
数值加计量单位
版本号:
V1.0
1010地震烈度SeismicIntensity
说明:
地震引起的地面震动及其影响的强弱程度。
(GB/T18207.1-2000<防震减灾术语:
基本术语>)
表示:
N..2
值域:
2位整数
版本号:
V1.0
1011(宏观)震中烈度(Macro)EpicentralIntensity
说明:
极震区的震中烈度。
(GB/T18207.1-2000<防震减灾术语:
基本术语>)
表示:
N..2
值域:
2位整数
版本号:
V1.0
1012震级类型MagnitudeType
说明:
标识给出的震级值所对应的震级类型。
表示:
S4
值域:
字符型
同义名称:
震级名称
版本号:
V1.0
1013近震震级localmagnitude
说明:
用近震记录测定的地震震级,用ML表示。
表示:
N3,1
值域:
数值型
同义名称:
地方震级
版本号:
V1.0
1014体波震级bodywavemagnitude
说明:
用地震体波测定的震级。
其中用短周期体波记录测定的以mb表示;用中周期体波记录测定的以mB表示。
国际上通用Mb表示。
表示:
N3,1
值域:
数值型
版本号:
V1.0
1015面波震级surfacewavemagnitude
说明:
用地震面波记录测定的地震震级,用MS表示。
表示:
N3,1
值域:
数值型
版本号:
V1.0
1016矩震级momentmagnitude
说明:
用地震矩换算的震级,用MW表示。
表示:
N3,1
值域:
数值型
版本号:
V1.0
1017地震能量seismicenergy
说明:
地震时震源辐射的弹性波的能量。
表示:
值域:
数值型
版本号:
V1.0
1018地震矩seismicmoment
说明:
对地震大小的一种绝对量度,用M0表示。
表示:
值域:
数值型
版本号:
V1.0
1019震源尺度focaldimension
说明:
从地震记录求得的表征震源大小的参数。
表示:
值域:
数值型
版本号:
V1.0
1020地震位错earthquakedislocation
说明:
地震断层错动的距离和方向。
表示:
值域:
三维向量
版本号:
V1.0
1021[地震]应力降[seismic]stressdrop
说明:
地震前后断层面上应力的下降值。
表示:
值域:
数值型
版本号:
V1.0
1022发震地点Place
说明:
发生地震的地方。
表示:
S..20
值域:
自由文本。
版本号:
V1.0
1023地震所在国家CountrywhereEarthquakeOccurred
说明:
发生地震的国家。
表示:
S..10
值域:
自由文本。
版本号:
V1.0
1024Flinn-Engdahl地震分区Flinn-EngdahlSeismicRagions
说明:
由Flinn和Engdahl首先提出的对全球的地震分区。
2002年5月31日修订版将全球分成44个地震区。
每个地震区又分成若干小区,共757个小区。
每个小区有一个唯一数字代码。
(DB/T2-2003<地震波形数据交换格式>的附录I)
表示:
N3
值域:
整型
版本号:
V1.0
1025地震位号EarthquakeLocationNumber
说明:
我国制订的表示地震所在地区的位置代码。
()
表示:
N2
值域:
整型
版本号:
V1.0
1026地震发生率earthquakeoccurrencerate
说明:
在给定的时间、空间和强度范围内,某个单位时间内地震发生的平均次数。
表示:
N
值域:
整型
版本号:
V1.0
1027地震频度earthquakefrequency
说明:
一定时空范围内,单位时间内发生的地震次数。
表示:
N
值域:
整型
版本号:
V1.0
1028地震基本烈度BasicIntensity
说明:
一个地区在未来一定时期内、一定场地条件和超越概率水平下可能遭遇的地震烈度。
例如,1990年颁布的〈中国地震烈度区划图〉定义地震基本烈度为:
50年期限内,一般场地条件下,可能遭遇超越概率为10%的地震烈度。
(GB/T18207.1-2000<防震减灾术语:
基本术语>)
表示:
N2
值域:
整型
版本号:
V1.0
1029场地烈度SiteIntensity
说明:
现场震害调查得到的宏观烈度。
字段名:
SITEINTE
表示:
N2
值域:
版本号:
V1.0
17.2 地震观测数据元
2001台网代码CodeofStationNetwork<测震>
说明:
地震台网的唯一标识。
例如,数字地震台网联盟(FDSN)对每个成员台网分配一个最多2个字符的台网代码,以便唯一地标识观测的地震数据流。
(DB/T2-2003附录H)。
表示:
S5
值域:
英文字母。
版本号:
V1.0
2002台网名NateworkName
说明:
中国地震台网的中文名称或外国地震台网的英文名称.
表示:
S..30
值域:
自由文本或英文。
版本号:
V1.0
2003台网级别
说明:
由中国地震局确定的我国地震台网的级别。
表示:
S..10
值域:
自由文本、字母或数字
版本号:
V1.0
2004台站代码StationCode<测震>
说明:
台站的代码。
中国的每个地震台站有一个由5位数字构成的台站代码(DB/T4-2003)。
表示:
N5
值域:
数字
版本号:
V1.0
2005台站名NameofStation
说明:
中国台站的中文名称或外国台站的英文名称.
表示:
S..30
值域:
自由文本或英文。
版本号:
V1.0
2006台站缩写名
说明:
台站的国际通用缩写名。
我国参与国际数据交换的台站(如测震台、地磁台等)都有由相应国际数据中心认可的台站缩写名称。
表示:
S5
值域:
英文字母和数字
版本号:
V1.0
2007台站纬度
说明:
台站的地理纬度。
北纬用正值表示,南纬用负值表示。
表示:
N7,3
值域:
数值型。
版本号:
V1.0
_________________________________________________________________________________________
2008台站经度
说明:
台站的经度。
东经用正值表示,西经用负值表示。
表示:
N8,3
值域:
数值型。
版本号:
V1.0
_________________________________________________________________________________________
2009台站高程
说明:
台站的海拔高度。
一般以米为单位。
表示:
N8,3
值域:
数值型。
版本号:
V1.0
2010台站级别
说明:
由中国地震局确定的我国地震台站的级别。
表示:
S..10
值域:
自由文本、字母或数字
版本号:
V1.0
2011台站管辖单位
说明:
负责管辖台站的单位
表示:
S..30
值域:
自由文本
版本号:
V1.0
2012值守状态StatusofAttendance
说明:
台站值班的状况(有无人员值守)。
表示:
S..10
值域:
自由文本。
版本号:
V1.0
2013台站测点名ObservationPointName
说明:
一个台站所属各测量点的名称。
表示:
S..30
值域:
自由文本。
版本号:
V1.0
2014台站测点号ObservationPointNumber
说明:
标识一个台站各观测点的顺序号。
表示:
N2
值域:
整型
版本号:
V1.0
2015观测类型
说明:
按地震数据分类与代码第2部分:
观测数据(DB/T11.2-200x)划分的观测类型,如测震、地磁、地电等。
表示:
S..30
值域:
自由文本
版本号:
V1.0
2016测项
说明:
进行观测的方法或方法门类。
(DB/T3-2003)
表示:
S..30
值域:
自由文本
版本号:
V1.0
2017测项代码
说明:
由DB/T3-2003规定的测项唯一代码。
表示:
N4
值域:
整型
版本号:
V1.0
2018台站记录类型RecordType
说明:
指记录方式,如“数字记录”、“模拟磁带记录”、“纸记录”、“照相记录”等。
表示:
S..30
值域:
自由文本。
版本号:
V1.0
2019台站观测资料(数据)存储地PlaceforDataStorage
说明:
台站观测资料(数据)的永久存放地点,如“台站本地”、“所在省(直辖市、自治区)地震局”等。
表示:
S..30
值域:
自由文本。
版本号:
V1.0
2020台站地质构造
说明:
对台站所处位置地下地质构造的概要描述
表示:
S..30
值域:
自由文本
版本号:
V1.0
2021台站开始观测日期BeginDateofObservation
说明:
台站开始记录数据的日期.
表示:
T8
值域:
采用GB/T7408中的YYYYMMDD格式表示。
版本号:
V1.0
_________________________________________________________________________________________
2022台站结束观测日期EndDateofobservation
说明:
台站终止记录数据的日期.
表示:
T8
值域:
采用GB/T7408中的YYYYMMDD格式表示。
版本号:
V1.0
2023数据采样率SamplingRate
说明:
单位时间数字化采样的个数。
表示:
N7,2
值域:
数值型
版本号:
V1.0
_________________________________________________________________________________________
2024样本数 Numberofsamples
说明:
记录数据文件中包含的样本数。
表示:
N6
值域:
整数
版本号:
V1.0
_________________________________________________________________________________________
2025事件记录起始时间BeginTimeofEvent
说明:
对判定的事件,开始记录数据的时间.
表示:
T15
值域:
采用GB/T7408中的YYYYMMDDThhmmss格式表示。
版本号:
V1.0
2026事件记录结束时间EndTimeofEvent
说明:
对判定的事件,终止记录数据的时间。
表示:
T15
值域:
采用GB/T7408中的YYYYMMDDThhmmss格式表示。
版本号:
V1.0
_________________________________________________________________________________________
2027观测数据文件名FileNameofObservationData
说明:
保存观测数据的文件的名称。
表示:
S..20
值域:
字母和数字
版本号:
V1.0
2028异常数据文件名FileNameofAbnormalityData
说明:
该数据文件保存判定为异常事件的观测数据。
表示:
S..20
值域:
字母和数字
版本号:
V1.0
2029异常起始时间BeginningTimeofAnomaly
说明:
出现异常现象的时间.
表示:
T8
值域:
采用GB/T7408中的YYYYMMDD格式表示。
版本号:
V1.0
2030异常结束时间EndTimeofAnomaly
说明:
异常现象消失的时间.
表示:
T8
值域:
采用GB/T7408中的Y