SOA架构电子政务行业数据建模规范Word格式文档下载.doc
《SOA架构电子政务行业数据建模规范Word格式文档下载.doc》由会员分享,可在线阅读,更多相关《SOA架构电子政务行业数据建模规范Word格式文档下载.doc(40页珍藏版)》请在冰点文库上搜索。
GB/T19488—2004《电子政务数据元第1部分:
设计和管理规范》
DB11/T337—2006《政务信息资源目录体系》技术性指导文件
DB11/Z359—2006《面向公共服务的政务信息分类标准》
GB/Txxxx-xxxx《政务信息资源目录体系》(送审稿):
――第1部分:
总体框架;
――第2部分:
技术要求;
――第3部分:
核心元数据;
――第4部分:
政务信息资源分类;
――第5部分:
政务信息资源标识符编码方案;
――第6部分:
技术管理要求。
GB/T7027—2002信息分类和编码的基本原则与方法
GB/T10113—2003分类与编码通用术语
GB/T19486—2004电子政务主题词表编制规则
GB/T7408数据元和交换格式、信息交换、日期和时间表示法(idtISO8601:
2002)
GB/T18391.1—2002信息技术数据元的规范和标准化第1部分:
数据元的规范与标准化框
架(idtISO/IEC11179-1:
1999)
GB/T18391.2—2003信息技术数据元的规范和标准化第2部分:
数据元的分类
(idtISO/IEC11179-2:
2000)
GB/T18391.3—2001信息技术数据元的规范和标准化第3部分:
数据元的基本属性
(idtISO/IEC11179-3:
1994)
GB/T18391.4—2001信息技术数据元的规范和标准化第4部分:
数据定义的编写规则指
南(idtISO/IEC11179-4:
1995)
GB/T18391.5—2001信息技术数据元的规范和标准化第5部分:
数据元的命名和标识则
(idtISO/IEC11179-5:
GB/T18391.6—2001信息技术数据元的规范和标准化第6部分:
数据元的注册
(idtISO/IEC11179-6:
1997)
3术语和定义
下列术语和定义适用本部分。
3.1
数据data
对事实、概念或指令的一种形式化表示,适用于以人工或自动方式进行通信、解释或处理。
[GB/T18391.1-2002,定义3.12]
3.2
信息information
是构成一定含义的一组数据。
3.3
数据元dataelement
用一组属性描述定义、标识、表示和允许值的数据单元。
[GB/T18391.1-2002,定义3.14]
3.4
电子政务数据元electronicgovernmentdataelement
电子政务数据元是指政务活动过程中涉及的所有数据元。
3.5
元数据metadata
定义和描述其他数据的数据。
[GB/T18391.1-2002,定义3.41]
3.6
数据元概念dataelementconcept
能以数据元的形式表示,且与任何特定的表示法无关的一种概念。
[GB/T18391.1-2002,定义3.15]
3.7
对象类objectclass
对象集。
现实世界中的想法、抽象概念或事物的集合,有清楚的边界和含义,并且特性和其行
为遵循同样的规则而能够加以标识。
[GB/T18391.1-2002,定义3.45]
3.8
实体entity
任何具体或抽象的事物,包括事物间的关系。
[GB/T18391.1-2002,定义3.30]
3.9
特性property
对象类的所有个体所共有的某种性质。
[GB/T18391.1-2002,定义3.48]
3.10
关系relationentity
个体之间的连接或关联。
3.11
属性attribute
某个对象或者实体的一种特性。
[GB/T18391.1-2002,定义3.3]
3.12
分类方案classificationschema
根据对象的共性如:
来源、构成、结构、应用、功能等将其排列或分组。
[GB/T18391.1-2002,定义3.6]
3.13
语境context
一个名称所用于的或所源自的应用环境或规程的描述。
3.14
值域valuedomain
允许值的集合。
[GB/T18391.1-2002,定义3.75]
3.15
注册机构registrationauthority
经授权对数据元或其他对象注册的组织。
[GB/T18391.1-2002,定义3.56]
3.16
提交机构submitorganization
对数据元注册系统的数据元提出增补、变更或取消或撤出的机构或其所属部门。
[GB/T18391.1-2002,定义3.68]
3.17
业务建模 businessmodeling
通过图示和文字等手段将具体的包括业务分工、业务流程、业务信息等方面的业务模型表达出来的一种方式。
3.18
数据建模 datamodel
通过一个全局信息需求视图来说明系统中所有基本数据实体及其相互关系构造整个模型
3.19
业务模型 businessmodel
对一个组织的业务分工、业务流程、业务信息等方面业务内容的描述。
3.20
数据/信息模型 data/informationmodel
描述在该环境(或系统)中的信息/数据的结构和语义。
数据/信息模型的基本构件是实体、联系和属性。
数据是指记载下来的事实,是客观实体属性的值,而信息是构成一定含义的一组数据。
3.21
概念模型conceptualmodel
对真实世界中问题域内的想法、事物或对象的描述。
例如人、企业、就业。
对应于信息世界中的信息模型,在计算机世界中对应于问题域内各个事物的分类。
3.22
类category;
class
具有某种共同属性(或特征)的事物或概念的集合。
[GB/T10113-2003,术语2.1.1]
3.23
分类classification
按照选定的属性(或特征)区分分类对象(3.4),将具有某种共同属性(或特征)的分类对象(3.4)集合在一起的过程。
[GB/T10113-2003,术语2.1.2]
3.24
信息分类informationclassifying
把具有某种共同属性或特征的信息归并在一起,把具有不同属性或特征的信息区别开来的过程。
[GB/T10113-2003,术语2.1.3]
3.25
分类对象objectsofclassification
被分类的事物或概念。
[GB/T10113-2003,术语2.1.4]
3.26
标识符identifier
用于标识或命名一个数据项目并可能指出该数据确定性质的一个或一组字符。
[GB/T14915-1994中定义]
3.27
政务信息资源标识符governmentinformationresourceidentifier
用于唯一标识政务信息资源的一组字符。
3.28
数据建模图形符号
本标准使用的建模图形符号如表1所示。
(参考)
表1 建模符号
图形符号
符号名称
应用于
说明
独立实体
依赖实体
业务信息名称
栏目1
栏目2
业务信息
1 业务信息内容图
2 业务信息关系图
又可称为信息实体或者类,其简化形式只描述信息名称,表达方式如下
计算合成链
业务信息关系图
1 其上方是综合性业务信息图形符号
2 其下方是原始性业务信息图形符号
事件
业务信息1
业务信息2
事件链
1 职责执行/操作流程图
2 业务协作流程图
业务流程
1业务协作流程图
2业务信息共享图
1 业务流程要有编号
2 编号格式以及标注位置由用户自定义
数据流
业务协作流程图(自由型)
1 建议数据流有编号
注释
所有
5
北京市领导决策信息资源元数据规范
4电子政务数据建模框架
4.1数据建模的概念
数据建模通过业务梳理和数据流分析环境/系统中的实体,实体的属性以及实体之间的关系完成建模过程。
数据建模通过一个全局信息需求视图来说明问题域中所有实体及其相互关系,然后在此基础上逐步构造整个模型。
4.2数据建模方法
4.2.1概念模型建模
概念模型的建模是通过梳理和分析模型真实世界中问题域内的想法、事物或对象,建立对应于信息世界中的信息模型,并进行规范描述的过程。
在计算机世界中对应于问题域内各个事物的分类。
可以用IDEF1X信息/数据建模和对象角色建模(ORM)等建模方法建立概念模型。
IDEF1X信息/数据建模方法主要基于由IEEE认证的ANSI/IEEE1320.2.1标准,IDEF1X数据建模已经成为业界公认的信息建模标准。
概念/信息模型描述在环境(或系统)中的实体或对象,以及之间的关系的信息结构和语义。
对象角色建模(ORM)是以简单对象和论断的形式描述事物或对象。
ORM把现实世界表示为具有角色(关系中的部分)的一组对象(实体或值)。
概念模型的图形表达如图所示。
学生
教师
学校
课程
*
1
上课
课程选修
备课
入学
图1概念模型的图形
在图1的学生上学问题域概念模型中,学生、学校、教师、课程都是学生上学问题域有相互联系的实体或对象,入学,课程选修,上课和备课都是以上实体之间的关系或对象。
4.2.2数据建模
数据建模将概念模型映射为计算机世界的数据结构,对应于数据库的一个表。
数据模型的基本构件包括实体(Entity)、关系(relationship)、属性(Attribute)与键值(Key)等。
实体关系(ER)是以术语实体(拥有属性并参与关系)描述现实世界的数据建模方法,是一种数据库建模的实体关系方法。
数据模型的图形表达法如图2所示。
PK学号
学生姓名
性别
PK教师编号
教师姓名
FK课程号
PK学校编号
学校名称
地址
PK课程编号
课程名称
FK教师编号
课时
图2数据模型的实体、关系和属性图
在上图表达的数据模型中,学生是一个独立实体,它由属性学号、学生姓名、性别等进行描述。
学校、教师和课程是依赖实体,由相关属性描述。
学生与教师和课程都是多对多的关系。
IDEF1X的数据/信息建模与实体关系(ER)数据建模是同一类建模方法,都是基于实体关系的数据建模方法。
实体(Entity)
关于环境/系统中所存在的任何具体或抽象的事物的数据,例如人、地点、事件或观念等。
实体可以对应到数据库系统的Table或一个有含义的文档。
实体分为独立实体和依赖实体。
方角矩形的图表示它是独立实体,不依赖于其他实体而单独存在;
圆角矩形的图表示它是依赖实体,它的存在依赖于其他实体。
属性(Attribute)
实体所维护的数据的一种特性。
属性可以说是实体的细部定义。
属性会在实体的方块中一行一行的列出。
属性可分为两种,具有键值的(Key)以及一般属性(Non-Key)。
关系(Reationship)
实体之间的连接或关联。
关系会将两个实体以线条连接,实线表示具有辨别性(Identifying)的关系,也就是说,父层的主键(primarykey)会因为关系的成立,而移转成为子实体的主键。
虚线则表示不具有辨别性(Identifying)的关系,父层实体的主键是移转到子实体的一般属性中。
数据模型的关系也可表达主从的个数,如一对一,一对多,或一对四等。
流行的数据建模工具有CA的ERwin、Sysbase的PowerDesigner、以及IBM的RationalRose等。
4.3数据模型的描述与表示
数据模型中的实体、属性等通过数据元、信息分类和元数据描述。
数据元概念遵循GB/T18391.1—2002《信息技术数据元的规范和标准化》的定义。
数据模型中的实体相当于对象类数据元,而实体的属性相当于特性和表示的数据元。
分类结构体现信息和数据的类别关系,信息/数据模型的数据元和信息的内容和管理属性由元数据描述。
图3数据模型的描述与表示
数据建模规范就是对数据/信息模型中描述实体、关系、属性的数据元、值域、分类、标识、元数据和术语进行规范,使之具有一致的内涵和表示,为数据/信息的交换共享建立基础。
4.4数据建模规范的总体架构
在数据建模中,需要对与数据/信息模型相关的实体、属性和关系的表达进行规范,重点是实体、数据元、分类,元数据和信息标识符的规范。
图4数据建模规范的总体架构图
数据建模规范的总体架构由五部分组成:
1)实体:
实体是任何具体或抽象的事物的数据,是数据建模的一种重要输入。
2)数据元:
又称数据类型,通过定义、标识、表示以及允许值等一系列属性描述的数据单元。
在特定的语义环境中被认为是不可再分的最小数据单元。
3)元数据:
元数据标准按其描述对象,可分为资源责任方属性、资源内容属性、资源表示方式、管理属性以及元数据属性等实体。
4)分类:
分类是把具有某种共同属性或特征的数据/信息归并在一起,通过其类别的属性或特征来对数据/信息进行区别,据以建立分类体系,以满足对信息资源的收集、查询、浏览和服务的需要。
重点考虑主题、业务、服务和信息资源形态等分类。
5)标识符编码方案:
用于标识或命名数据/信息项目的一组字符。
包括数据元、信息资源的标识符编码方案,
5电子政务行业数据模型建模规范
电子政务领域数据建模的具体方法有以业务梳理为出发点的数据建模过程和以数据流分析出发点的数据建模过程。
(参考GB/T19487—2004《电子政务业务流程设计方法通用规范》)
在电子政务数据建模中,需要对与数据/信息模型相关的实体、数据元、元数据、信息分类和信息的标识符进行规范。
5.1数据元
本规范遵循GB/T19488—2004《电子政务数据元第1部分:
设计和管理规范》。
电子政务数据元是指政务活动过程中涉及的所有数据单元。
电子政务数据元是属于政府业务这一特定领域的数据元。
它的概念和结构遵循一般数据元的概念和结构,是通用数据元的一个子集,并具有自身的特点。
电子政务数据元采用相关的元数据来描述数据元的属性。
这些元数据帮助用户理解和使用电子政务数据元。
电子政务数据元标准中制订了数据元所需的元数据,例如分类方案、命名、定义、注册等。
电子政务数据元标准由两大部分组成:
a)第1部分:
设计和管理规范
主要阐述电子政务数据元的设计和管理的方法论;
b)第2部分:
数据元目录
本规范依照第1部分中规定的数据元设计和管理规范制订的电子政务数据元。
主要包括以下内容:
1)电子政务数据元框架
该部分对电子政务数据元进行整体的介绍和描述,对基本概念和术语进行定义和阐述,协调其余各部分之间的关系,规定其余各部分的功能及作用。
2)电子政务数据元表示规范
该部分对电子政务数据元的所有属性做出一系列详细的、可行的规定,以便形成一个完整规范的电子政务数据元。
3)电子政务数据元设计方法
该部分将从电子政务数据元的提取及分析方法、分类规则、命名规则、标识符分配规则以及定义的编写规则等方面来说明如何设计一个符合规范的数据元。
4)电子政务数据元的注册和管理
该部分对如何建立注册机构、如何提交数据元、如何对数据元进行维护和管理做出一系列的规定。
电子政务数据元标准结构如图5所示:
图5电子政务数据元标准结构
5.2元数据
5.2.1 元数据的概念
元数据是描述其他数据的数据,或者说是用于提供某种资源的有关信息的结构数据。
元数据是描述信息资源或数据等对象属性的数据,其使用目的在于:
识别资源;
评价资源;
追踪资源在使用过程中的变化;
实现简单高效地管理大量网络化数据;
实现信息资源的有效发现、查找、一体化组织和对使用资源的有效管理。
元数据可处理各种形式的数字化和非数字化数据资源,可以将元数据看成是一种描述数据模型和数据的语言,如描述一本图书的书名、作者、出版社、摘要、出版日期等属性就是图书的元数据。
元数据的基本单元为元数据元素。
为了清晰地表现元数据结构,方便管理,可以将一组相关的元数据元素集合定义为一个元数据实体。
元数据框架或元数据模型由多个元数据实体构成。
元数据也是数据,可以用类似数据的方法在数据库中进行存储和获取。
如果提供数据元的组织同时提供描述数据元的元数据,将会使数据元的使用变得准确而高效。
用户在使用数据时可以首先查看其元数据以便能够获取所需信息。
5.2.2 元数据规范
5.2.2.1.数据元素元数据规范
数据元表示规范是通过描述数据元的一系列属性来实现的。
这些属性实际上是数据元的元数据。
参考GB/T18391.3—2001《信息技术数据元的规范与标准化》和GB/T19488—2004《第1部分:
电子政务数据元设计和管理规范》中数据元属性的描述方法。
数据元属性依照下列标准方式来描述。
a)名称
赋予数据元属性的标记。
名称是唯一的。
名称以字符串形式表示。
b)定义
属性的描述,可使一种属性与其他属性清晰地区别开来。
定义以字符串形式表示。
c)约束
显示一个属性是始终还是有时出现的描述符。
该描述符可以有两个取值:
必选或可选,前者表示该属性必须出现,后者表示该属性可以出现,也可以不出现。
d)出现次数
显示一个属性出现多少次的描述符。
该描述符有以下四种情况:
0:
1(表示不出现或出现1次),0:
n(表示不出现或出现n次),1:
1(表示出现且仅出现1次),1:
n(表示出现1次或n次)。
e)数据类型
描述属性的所有取值的类型。
属性值的数据类型示例有:
“字符”、“字符串”、“数字”、“日期”。
f)备注
与属性应用有关的注释。
详细参考以上两个国家标准。
5.2.2.2.信息资源元数据规范
信息资源元数据用于描述信息资源的内容、表示方式、质量、管理方式、管理者以及其它属性,信息资源元数据是描述信息资源,实现信息资源发现、交换和服务的基础。
长风联盟政务信息资源核心元数据规范遵循我国正在编制的《政务信息资源目录体系第3部分核心元数据(征求意见稿)》中对资源核心元数据的定义,在此基础上根据应用需要进行了修订和扩充。
长风联盟政务信息资源核心元数据规范按其描述对象分为资源负责方属性、资源内容属性、资源表示方式、管理属性以及元数据属性等5个元数据实体。
图6为政务信息资源核心元数据实体关系图。
核心元数据
资源内容属性
资源负责方属性
资源表示方式
管理属性
元元数据属性
图6政务信息资源核心元数据实体关系图
政务信息资源核心元数据具体内容如下:
1)资源内容属性:
资源名称;
资源摘要;
关键字;
资源分类;
资源语种;
时空范围;
2)资源负责方属性:
资源负责方;
资源来源;
资源权限;
资源保密等级;
3)资源表示方式:
资源格式;
资源类型;
4)资源管理属性:
资源标识符;
资源日期;
更新周期;
资源获取方式;
在线资源链接地址;
5)元数据属性:
元数据标识符;
元数据联系方;
元数据日期;
元数据语种;
元数据访问限制。
共包含22个核心元数据实体或元素。
规范对元数据元素的主要属性从定义、英文名称、数据类型、值域、短名、注解等6个方面进行了描述。
政务信息资源核心元数据规范还定义了核心元数据的代码表,可参考附件XX。
限制代码表见表A.1,安全限制分级代码表见表A.2,字符集代码表见表A.3,资源分类代码表见表A.4,资源类型代码表见表A.5。
详细内容见附件XXX。
联盟各企业在进行数据/信息建模和开展政务信息资源目录体系建设中,在遵循本规范的基础上,可参考《政务信息资源目录体系》国家标准以及地方标准,根据政务信息资源的特点和应用需求,在政务信息资源核心元数据基础上进行扩充或减少。
通过元数据与信息分类、主题词表的结合,可以方便地根据应用需要组织信息资源应用目录、部门目录、分类目录和其他目录,构成信息资源目录体系。
借助信息资源目录体系实现对数字资源的导航、检索、定位和交换服务。
5.2.2.3.服务元数据规范
服务元数据用于描述SOA各类服务的内容、表示、质量、管理方式、管理者以及其它属性。
服务元数据是实现服务的注册、发现、交换和管理的基础。
长风联盟电子政务服务元数据规范遵循联盟在编制的《电子政务行业业务服务描述规范》。
业务服务描述元数据包括服务的基本属性、实现属性、质量属性和扩展属性等几方面,详细内容见《电子政务行业业务服务描述规范》。
表2 业务服务描述元数据
中文名称
英文名称
定义
数据类型
值域
备注
服务基本属性
ServiceProfile
描述服务的基本属性
复合型
必选项;
最大出现次数为1
服务实现属性
ServiceGrounding
描述服务的实现相关属性
必选项,最大出现次数为1
服务质量属性
ServiceQos
描述