浙江省公共数据开放技术规范.docx
《浙江省公共数据开放技术规范.docx》由会员分享,可在线阅读,更多相关《浙江省公共数据开放技术规范.docx(28页珍藏版)》请在冰点文库上搜索。
浙江省公共数据开放技术规范
浙江省公共数据开放技术规范
1.数据开放界面规范
1.1范围
本标准规定了数据开放平台界面与内容规范要求,对数据开放平台与内容的设计原则、基础元素、通用区域、首页以及栏目等内容进行了规范。
本标准适用浙江省各级数据开放平台界面与内容的设计、开发。
1.2界面与内容设计原则
数据开放平台界面与内容设计,应遵循以下设计原则:
a)页面整体设计风格应一致,页面布局和用图、用色风格前后一致;
b)相同功能的元素规范应一致;
c)不同栏目版块内容不宜有交叉重复内容,共性较多的内容应尽量划分到同一栏目版块;
d)结构层次不宜超过3层;
e)常用信息内容、功能服务宜放到较浅层次;
f)信息内容获取和功能服务过程不宜超过3步,当需要更多步骤时应有明确提示。
1.3基础元素
颜色
数据开放平台所有页面风格应选用主流色彩风格,第一时间带给访问者信任感与权威感。
字体
数据开放平台界面与内容的常规字体应满足以下规范:
a)中文字体应采用微软雅黑,字号不宜超过17px;
b)合理设置页面行间距;
c)应避免大面积使用加粗、加下划线和倾斜字体;
d)标点符号宜采用中文格式半角;
e)英文和数字宜采用Arial字体。
尺寸
数据开放平台界面与内容的尺寸应满足以下规范:
a)数据开放平台界面所有页面最大宽度尺寸1366px;
b)内页分栏应按照统一规格设计,分两栏;
c)两栏的页面设计横向比例规范:
210px:
1016px;
d)当通过不同终端访问数据开放平台时,界面应能自适应的调整分辨率,以适应不同终端的不同显示效果的需要。
1.4通用区域
概述
页头位于数据开放平台页面的顶部,各页面均应展示页头部分,页头由数据开放平台标识、导航区组成。
1.4.1.1.数据开放平台标识
数据开放平台标识应满足以下规范:
a)中文名称为“**数据开放平台”;
b)字体为微软雅黑体;
页头
1.4.1.2.导航区
导航区栏目应包括首页、开放数据、接口服务、应用成果、地图服务、开发者中心、开放指数、互动交流、政策动态、数据检索、注册、服务条款、快速登录等。
页尾
数据开放平台页尾应满足以下规范:
a)页尾区提供网站地图、联系我们、网站声明、使用手册;
b)主办单位名称为主办单位全称;
c)版权申明内容为主办单位版权所有;
d)ICP备案内容为浙ICP备********号。
f)公网安备内容为浙公网安备********号
j)具有“建议使用1366*768分辨率/IE9.0或以上浏览器访问达到最佳效果”提示。
1.5页面布局
概述
数据开放平台各级页面由页头区、主体内容区、页尾区三部分组成。
页头区按5.1节给出的要求,页尾区按5.2节给出的要求。
主体内容区
主体内容区的栏目设置,宜依据实际业务需要自由设计。
主体内容区的颜色、常规字体、尺寸规范分别按4.1、4.2、4.3节给出的要求。
2.开放数据标准规范
2.1开放数据领域分类标准
数据开放平台领域分类应不少于21各分类:
安全生产、教育文化、科技创新、气象服务、商贸流通、社保就业、社会救助、生活服务、生态环境、市场监督、财税金融、信用服务、医疗卫生、资源能源、城建住房、地理空间、法律服务、工业农业、公共安全、机构团体、交通运输。
各设市区可以基于以上分类自行扩展个性化领域分类,同时鼓励各设区市开展场景分类,将数据集进行场景化展示,例如:
升学、培训考试、设立变更、申请专利等。
2.2数据集格式标准
数据开放平台应该提供至少5种数据格式,分别为:
XLS、CSV、XML、JSON、RDF。
注:
RDF格式(资源描述框架)作为W3C的推荐标准,使用了“主体-谓词-客体”三元组形式来描述数据资源和它们之间的关系,使数据资源更易于被机器阅读和理解,有助于数据利用者发现和链接相关数据资源。
附:
开放数据的格式标准,万维网发明者TimBernersLee提出了开放数据的五星标准
一星:
基于开放授权在网络上开放数据,对数据格式不做要求,可能采用PDF、JPEG等格式;
二星:
以可机读、结构化格式开放数据(如采用EXCEL格式而非扫描格式);
三星:
在满足二星标准的基础上,以非专属开放格式开放数据(如采用CSV格式代替EXCEL格式);
四星:
在满足以上要求的基础上,采用万维网联盟(W3C)的开放标准(如RDF和SPARQL)来识别数据集中的事物或主体,每个事物采用统一资源标识符(URI)来进行标识;
五星:
在满足以上要求的基础上,数据集提供更多的与其他数据集数据之间的关联链接,以便使用者在使用数据的同时发现更多的相关信息。
2.3数据集存储元数据标准
元数据
说明
1.数源单位
定义:
提供政务信息资源的政务部门。
数据类型:
字符型。
注解:
必选项;最大出现次数为1。
说明:
具体提供信息资源的部门和单位,原则上细化到内设机构和所辖政务部门。
2.信息资源名称
定义:
缩略描述政务信息资源内容的标题。
数据类型:
字符型。
注解:
必选项;最大出现次数为1。
说明:
缩略描述对应政务信息资源具体内容的标题。
3.信息资源代码
定义:
政务信息资源的唯一不变的标识代码。
数据类型:
字符型。
注解:
必选项;最大出现次数为1。
说明:
信息资源代码规则详见说明。
4.信息资源摘要
定义:
对信息资源内容(或关键字段)的概要描述。
数据类型:
字符型。
注解:
必选项;最大出现次数为1。
说明:
对资源内容进行概要说明(或关键字段)的描述。
5.信息资源格式
定义:
信息资源的存在方式(可多选)。
信息资源提供方应尽可能提供可机读的电子格式及相关软件版本信息,如只有纸质介质,应尽量提供电子扫描格式。
电子格式的信息资源,可采用但不限于:
电子文件的存储格式为OFD、wps、xml、txt、doc、docx、html、pdf、ppt等;电子表格的存储格式为et、xls、xlsx等;数据库类的存储格式为Dm、KingbaseES、access、dbf、dbase、sysbase、oracle、sqlserver、db2等,同时需明确具体的数据库表结构定义(可细化至“信息项信息”元数据中);图形图像类的存储格式为jpg、gif、bmp等;流媒体类的存储格式为swf、rm、mpg等;自描述格式,由提供方提出其特殊行业领域的通用格式,如气象部门采用的“表格驱动码”格式。
数据类型:
字符型。
注解:
必选项;最大出现次数为1。
说明:
按定义的多种格式选择确定。
6.标签
定义:
对信息资源内容进行关键字概要提取。
数据类型:
字符型。
注解:
必选项;最大出现次数为1。
说明:
对信息资源内容进行关键字段提取的描述。
7.数据领域
定义:
对信息资源内容进行主题领域划分。
数据类型:
字符型。
注解:
必选项;最大出现次数为1。
说明:
对信息资源内容进行主题领域划分描述。
8.行业分类
定义:
对信息资源所在主题领域的所属行业分类。
数据类型:
字符型。
注解:
必选项;最大出现次数为1。
说明:
对信息资源所在主题领域的所属行业进行分类。
9.更新频率
定义:
信息资源更新的频度。
分为实时、每日、每周、每月、每季度、每年等。
数据类型:
字符型。
注解:
必选项;最大出现次数为1。
说明:
属于结构化数据资源的,按更新频度较快的信息项进行描述;属于非结构化数据资源的,则对信息资源整体进行描述。
10.数据容量
定义:
信息资源中完全开放的字段数与数据条数的乘积。
数据类型:
字符型。
注解:
必选项;最大出现次数为1。
说明:
按定义要求进行描述。
11.所属行政区域
定义:
说明该信息资源内容提供方所在的行政区域。
数据类型:
字符型。
注解:
必选项;最大出现次数为1。
说明:
按定义要求进行描述。
12.发布日期
定义:
政务信息资源提供方发布共享、开放政务信息资源的日期。
数据类型:
日期型,格式为CCYY-MM-DD。
注解:
必选项;最大出现次数为1。
说明:
按定义要求进行描述。
13.信息项中文名称
定义:
描述结构化信息资源中具体数据项的标题。
适用于格式为数据库、电子表格类等的信息资源。
数据类型:
字符型。
注解:
可选项;最大出现次数为1。
说明:
描述电子表格、数据库,以及具有结构化数据内容资源中的各数据项(字段)标题,采用中文表示。
14.信息项英文名称
定义:
信息项的英文名。
数据类型:
字符型。
注解:
可选项;最大出现次数为1。
说明:
描述信息项的英文名。
15.字段描述
定义:
描述信息项表字段的具体文字说明。
数据类型:
字符型。
注解:
可选项;最大出现次数为1。
说明:
描述信息项的表字段描述信息。
16.数据类型
定义:
标明该信息项的数据类型。
其中,属于文本类信息的,应标明所采用的字符集和编码方式,推荐使用GB13000-2010及其后续版本字符集和UTF-8或UTF-16方式编码;属于结构化数据的,应标明数据类型及数据长度,包括:
字符型C、数值型N、货币型Y、日期型D、日期时间型T、逻辑型L、备注型M、通用型G、双精度型B、整型I、浮点型F等。
数据类型:
字符型。
注解:
必选项;最大出现次数为1。
说明:
对应“信息项名称”逐一描述其数据类型。
17.是否向社会开放
定义:
信息资源面向社会开放的属性,包括“是”和“否”,
对应取值分别为1和0。
数据类型:
字符型。
注解:
可选项;最大出现次数为1。
说明:
按定义要求进行描述。
18.开放条件
定义:
对向社会开放资源的条件描述。
当“是否向社会开放”取值为1时,描述开放条件。
数据类型:
字符型。
注解:
可选项;最大出现次数为1。
说明:
按定义要求进行描述。
19.是否字典项
定义:
该信息项是否有字典项,如是,则可以选择字典表或填写备注。
数据类型:
字符型。
注解:
可选项;最大出现次数为1。
说明:
按定义要求进行描述。
20.是否主键
定义:
该信息项是否为数据表的主键,包括“是”和“否”,
对应取值分别为1和0。
数据类型:
字符型。
注解:
可选项;最大出现次数为1。
说明:
按定义要求进行描述。
21.是否为空
定义:
该信息项是否为数据表的主键,包括“是”和“否”,
对应取值分别为1和0。
数据类型:
字符型。
注解:
可选项;最大出现次数为1。
说明:
按定义要求进行描述。
说明:
信息资源代码编码规则
(1)信息资源“类”,即信息资源的一级分类,用1位阿拉伯数字表示。
根据政务信息资源目录的资源属性分类规定的分类方法,“1”代表基础信息资源类,“2”代表主题信息资源类,“3”代表部门信息资源类。
(2)信息资源“项”,即信息资源的二级分类,共2位,原则上用阿拉伯数字表示。
如,基础信息资源类中的人口、法人信息资源等分类;主题信息资源类中的公共服务、全民健康、全民社保等分类;部门信息资源类中的省委政法委(省综治委)、省编办、省信访局等分类。
(3)信息资源“目”,即信息资源的三级分类,共3位,原则上用阿拉伯数字表示。
(4)信息资源“细目”,不定长度,原则上用阿拉伯数字表示,供信息资源提供方进行具体的信息资源分类。
“细目”可根据需要设置多级分类。
2.4数据集展示元数据标准
每个数据集的描述元数据应不低于21项:
具体如下:
信息资源名称、信息资源摘要、资源代码、标签、更新周期、资源格式、数源单位、数源单位地址、访问下载次数、数据领域、业务系统名称、评分评价次数、行业分类、数据预览、数据等级、开放条件、数据范围、更新日期、发布日期、数据量、数据图谱。
2.5API接口展示元数据标准
每个API接口元数据描述应不低于9项,具体如下:
信息资源名称、信息资源摘要、数据领域、更新周期、资源格式、数源单位、数源单位地址、访问次数、数据预览。
2.6API接口描述标准
数据开放平台提供的API接口应有明确的接口描述、接口地址、支持格式、请求方式、请求参数、请求样例、返回参数、返回样例等说明。
每个数据集需要提供获取总量接口、分页接口两个接口类型,方便使用者获取全量和增量数据。
以下为省数据开放网站接口说明供参照:
(一)获取数据总量接口
接口地址
http:
//域名/jdop_front/interfaces/cata_数字/get_total.do
支持格式
JSON
请求方式
GET/POST
接口描述
获取数据总数
请求样例
/jdop_front/interfaces/cata_5535/get_total.do?
appsecret=5a558b60a9384771a393287f051cd6c0
请求参数
appsecret:
注册用户接口申请通过后的校验码
返回样例
{"status":
1,"msg":
"成功","data":
200}
返回参数说明
status:
0代表失败,1代表成功
msg:
返回信息
data:
返回个数
(二)分页获取数据详细接口
接口地址
http:
//域名/jdop_front/interfaces/cata_数字/get_data.do
支持格式
JSON
请求方式
GET/POST
接口描述
分页获取数据详细
请求样例
/jdop_front/interfaces/cata_5535/get_data.do?
pageNum=1&pageSize=1&appsecret=5a558b60a9384771a393287f051cd6c0
请求参数
appsecret:
注册用户接口申请通过后的校验码
pageNum:
页码
pageSize:
每页个数(不超过200)
返回样例
{"status":
1,"msg":
"成功","data":
[{"iid":
1,"filepath":
"E:
/APP","fileserverurl":
"http:
//192.168.89.58:
80","searchday":
7,"searchper":
1,"searchtimes":
1,"searchurl":
"http:
//127.0.0.1:
8080/searchserver_local","searchdb":
"jdop1_1"}]}
返回参数说明
status:
0代表失败,1代表成功
msg:
返回信息
data:
信息的详细属性
2.7应用成果展示元数据规范
应用成果提交应分为4类,分别是:
服务应用、传播产品、创新方案和研究成果。
(1)服务应用,即企事业单位利用开放数据开发的各种服务应用,如:
APP应用、小程序应用或网站应用。
服务应用元数据应不低于9项:
具体为:
应用名称、标签、领域分类、开发团队、数据集名称、图片、描述、应用访问地址、应用详情。
(2)传播产品,即将开放数据经过分析或可视化处理后,以公众易于理解的数据新闻、自媒体文章等形式向社会传播。
传播产品元数据应不低于8项:
具体为:
标题、领域分类、开发团队、图片、附件、视频地址、访问地址、描述。
(3)研究成果,即高校、研究机构、社会团体等主体利用开放数据产生的研究报告、学术论文等成果。
创新方案元数据应不低于6项:
具体为:
标题、领域分类、开发团队、图片、附件、描述。
(4)创新方案,即各地开放数据创新利用比赛中参赛者产生的创新方案。
研究成果元数据应不低于6项:
具体为:
标题、领域分类、开发团队、图片、附件、描述。
3.域名及用户对接规范
3.1域名使用规范
省数据开放网站域名为:
,各设区市域名应采用省数据开放网站域名的二级域名来访问。
二级域名的组成方式为:
“地区简称”+““。
各地区简称如下:
部门名称
域名简称
部门名称
域名简称
省级
zj
杭州
hz
宁波
nb
温州
wz
嘉兴
jx
湖州
huz
绍兴
sx
金华
jh
衢州
qz
舟山
zs
台州
taz
丽水
lis
3.2用户对接规范
各设区市数据开放用户需要和浙江政务服务网统一用户进行整合,政务服务网注册的用户不用二次登录可以直接使用各平台的开放数据。
4.省数据开放网站前台功能
4.1概述
主要描述省数据开放网站的相关功能,各设区市子网的功能应包括但不限于文档描述的相关功能。
4.2数据开放栏目设置
数据开放平台设置的一级栏目包含但不限于以下六项:
数据集、接口服务、应用成果、开发者中心、开放指数、互动交流。
省数据开放网站栏目概况示意图见图1。
图4-1栏目概况示意图
4.3数据开放
数据集列表
数据集是由数据组成的集合,在数据开放平台中,能够从数据提供机构、领域分类、格式分类对数据集进行分类筛选的展现。
能够通过数据集名称关键词进行检索,能够按照访问量、更新时间、下载量、数据容量、数据评分等维度进行排序。
数据集的前台访问以列表形式进行展现,在列表页展现数据集的摘要信息,包括:
数据集名称、评分、简介、数据容量、本数据集支持的格式、提供者、所属领域、查看次数、下载次数、更新时间等,具有收藏和数据预览的快速入口。
数据集详细页
各数据集详细页提供数据集详情展示与申请等操作功能,数据集元数据格式规范详见:
第二章数据集展示元数据标准。
提供数据集的收藏、订阅、纠错功能。
提供数据集预览和可视化入口。
提供数据集API调用入口。
提供数据集数据图谱展示入口。
提供数据集下载和历史数据下载入口。
提供当前数据集内数据项预览展示。
提供当前数据集关联信息列表展示。
提供当前数据集的相关开发应用成果。
提供对本数据集的评分和评论操作功能。
数据目录
平台应提供开放数据资源目录,帮助用户了解开放数据全貌。
数据资源目录应能按照单位进行筛选显示,以列表形式展现,列表页主要展现数据资源名称、数据单位、目录发布时间、信息项摘要等。
可视化与分析工具
可视化与分析工具是指提供了实现数据集可视化或统计分析的工具。
用户可以在数据集页面通过设置不同条件,对数据进行初步的统计分析,还可以对统计结果进行可视化呈现,如饼状图、柱状图和曲线图。
4.4接口服务
接口列表页
除直接下载数据以外,还应提供开放数据的应用程序编程接口(即API接口,ApplicationProgrammingInterface),与通过直接下载方式获取数据集相比,接口方式使用户可以通过参数实施高效的获取所需数据,满足开发应用程序的需要。
在数据开放平台中,能够从数据提供机构和领域分类对数据集进行分类筛选的展现。
能够通过接口名称关键词进行检索,能够按照访问量、更新时间、调用量、数据评分等维度进行排序。
接口的前台访问以列表形式进行展现,在列表页展现接口的摘要信息,包括:
数据接口名称、评分、简介、提供者、所属领域、查看次数、下载次数、更新时间、接口申请等。
接口详细页
各接口详细页提供接口详情展示与申请等操作功能,接口元数据格式规范详见:
第二章API接口展示元数据标准。
提供接口的收藏、纠错功能。
提供总数接口、分页接口、分页返回接口调用方式描述。
提供接口申请入口。
提供对本接口的评分和评论操作功能。
4.5应用成果
数据利用成果指的是数据开放平台向社会集中展现用户利用平台上开放的数据后产生的各类数据利用成果,例如:
APP应用、研究报告、传播产品等,从而形成从数据开放、被利用到产生价值的闭环。
应用成果列表页
在数据开放平台中,能够从领域和成果类型对应用成果分类进行筛选展现。
能够通过应用成果名称关键词进行检索。
应用成果的前台访问以列表形式进行展现,在列表页展现应用成果的摘要信息,包括:
应用成果名称、评分、所属领域、简介、查看次数、下载次数等。
应用成果详细页
各应用成果详细页提供应用成果详情展示,应用成果元数据格式规范详见:
第二章应用成果展示元数据规范。
提供接口的收藏、纠错功能。
提供对本应用成果的评分和评论操作功能。
成果提交
在个人中心中,用户可以提交自己基于开放数据开发的应用成果。
可选择服务应用、传播产品、创新方案和研究成果等类型分别上传。
填写应用名称、标签、所属领域、开发团队、基于的数据集、成果截图、成果简介描述等,提交上传后审核即可上架。
4.6地图服务
提供地理空间利用工具,使用者可以基于有地理位置的开放数据,在地图上叠加各种数据图层。
如:
全省的五星级饭店、学区、自来水监测点等地理位置数据。
4.7开发者中心
开放数据、开放接口的最新更新、最多下载、最高评分等。
开发手册提供平台总体介绍、开发新手入门、接入指南、审核流程等文档服务。
4.8开放指数
数据开放平台具备数据统计功能,部门数据量、数据容量统计排行、访问来源追溯、领域开放排行统计、平台的数据更新趋势、数据集下载接口调用排行统计、搜索热词、用户需求等方面的统计。
4.9互动交流
互动交流是指政府数据开放平台提供的功能便于用户与数据提供方进行双向沟通,针对具体数据集提交评价,提出数据请求和向平台提供建议反馈等。
数据集评价功能
政府数据开放平台通过星级评价和文字评价两种途径,较为具体地展现用户对于数据集的评分与具体意见。
数据请求功能
数据请求功能使用户可以在平台上提出其希望开放的数据,这一功能有助于数据提供方获知社会的数据需求。
建议反馈功能
数据开放平台开设建议反馈功能向用户采集建议,包括问卷调查和填写文字性的咨询建议等方式。
数据纠错功能
数据纠错功能是指用户可以向平台提出其发现的特定数据集存在的错误,有助于数据提供方提高开放数据的准确性。
分享传播功能
在平台上提供分享传播功能,用户可将平台上的信息在微博、微信和QQ等社交媒体平台传播,有助于提升政府数据开放平台的热度和影响力,吸引更多的政府、企业、社会团体和公众参与其中。
社交媒体账号开设
社交媒体账号开设是指政府数据开放主管部门设立专门的社交媒体帐号(如微博、微信等),向社会宣传推广本地的数据开放工作,并与社会公众通过社交媒体进行直接互动。
4.10政策动态
数据开放平台提供与数据开放相关的最新资讯,包括数据开放新闻动态和数据开放政策法规,提供例如:
国家和省内最新的政策文件、工作计划、开放清单、数据创新活动等,有利于用户了解最新活动和政策。
4.11用户使用相关流程
用户注册流程
用户使用浙江省统一用户平台进行注册,需要填写完整的用户信息,包括登录名、密码、真实姓名、身份证、性别、手机、邮箱、行业、职业等;同时接受浙江省政府数据开放平台的用户协议即可完成用户的注册。
注册成功的用户可以获得浙江省政府数据开放平台提供的数据集下载、接口申请、应用管理、订阅、收藏等服务。
图4-2用户注册流程示意图
接口申请流程
在平台上成功注册的用户可以创建应用。
用户创建应用时,在浙江省政府数据开放平台上申请相关数据接口,利用接口获取相关政府数据。
用户成功申请接口需要经过以下流程:
1)选择应用所属领域,创建应用;
2)选择需要申请的接口;
3)填写申请需求分类、申请理由;
4)同意用户协议;
5)平台管理员审核用户接口申请请求;
6)审核通过,平台发送消息通知用户;
7)利用创建应用的appscre