石家庄市生态环境综合管理平台项目详细设计方案V1.0

发布时间:2021-12-17 | 杂志分类:其他
免费制作
更多内容

石家庄市生态环境综合管理平台项目详细设计方案V1.0

石家庄市生态环境综合管理平台项目I目 录 项目概述 .......................................................................................... 11.1 项目背景.......................................................................................... 11.2 现状分析.......................................................................................... 11.3 建设目标.......................................................................................... 31.3.1 “一中心”实现数据融合......................................................... 31.3.2 ... [收起]
[展开]
石家庄市生态环境综合管理平台项目详细设计方案V1.0
粉丝: {{bookData.followerCount}}
文本内容
第1页

石家庄市生态环境综合管理平台

建设单位: 石家庄市生态环境局

编制单位:中电万维信息技术有限责任公司

二〇二一年十月

第2页

石家庄市生态环境综合管理平台项目

I

目 录

项目概述 .......................................................................................... 1

1.1 项目背景.......................................................................................... 1

1.2 现状分析.......................................................................................... 1

1.3 建设目标.......................................................................................... 3

1.3.1 “一中心”实现数据融合......................................................... 3

1.3.2 “一幅图”提供决策支撑......................................................... 4

1.3.3 “两应用”助力精准治理......................................................... 4

1.4 建设依据.......................................................................................... 4

1.4.1 政策依据............................................................................... 4

1.4.2 技术依据............................................................................... 5

需求分析 .......................................................................................... 7

2.1 推进生态环境数据汇聚融合........................................................... 7

2.2 提升生态环境科学决策能力........................................................... 7

2.3 提升生态环境精细化管理能力....................................................... 7

2.4 整合生态环境现有业务系统........................................................... 8

总体规划方案 .................................................................................. 9

3.1 建设原则.......................................................................................... 9

3.1.1 坚持急用先行、分步实施推广 ........................................... 9

3.1.2 坚持立足现有、逐步优化完善 ........................................... 9

3.1.3 坚持统一标准、支撑协同联动 ........................................... 9

3.1.4 坚持问题导向、强化测管协同 ........................................... 9

第3页

石家庄市生态环境综合管理平台项目

II

3.1.5 坚持互联互通、推动共享开放 ......................................... 10

3.2 总体设计........................................................................................ 10

3.2.1 总体架构............................................................................. 10

3.2.2 技术路线............................................................................. 12

建设内容 ........................................................................................ 15

4.1 生态环境数据资源中心 ................................................................ 15

4.1.1 信息资源规划................................................................... 15

4.1.2 数据基础平台..................................................................... 30

4.1.3 数据资源中心..................................................................... 33

4.1.4 智能分析计算..................................................................... 80

4.1.5 数据中台服务..................................................................... 97

4.1.6 自建系统整合................................................................. 103

4.2 生态环境大数据决策分析 .......................................................... 103

4.2.1 生态环境全景图............................................................... 103

4.2.2 重点任务目标分析........................................................... 110

4.2.3 蓝天保卫战....................................................................... 116

4.2.4 碧水保卫战....................................................................... 117

4.2.5 净土保卫战....................................................................... 119

4.2.6 督察执法........................................................................... 120

4.2.7 专项督察........................................................................... 122

4.2.8 环境执法........................................................................... 123

4.2.9 应急专题........................................................................... 124

第4页

石家庄市生态环境综合管理平台项目

III

4.2.10 固废监管......................................................................... 126

4.2.11 核与辐射......................................................................... 127

4.2.12 数据资产分析................................................................. 129

4.3 业务监管精细化应用 .................................................................. 131

4.3.1 大气管理一张图............................................................... 131

4.3.2 大气环境管理目标考核................................................... 136

4.3.3 大气环境监测数据管理................................................... 140

4.3.4 大气污染源排放清单管理 ............................................... 141

4.3.5 环境空气质量预报预警................................................... 152

4.3.6 大气污染源头监管........................................................... 157

4.3.7 机动车遥感监测............................................................... 167

4.3.8 大气环境目标管控决策分析 ........................................... 169

4.3.9 餐饮油烟智能监管........................................................... 173

4.4 业务协同调度中心...................................................................... 175

4.4.1 决策指挥调度中心........................................................... 175

4.4.2 污染源监督执法系统....................................................... 178

4.5 生态环境移动端.......................................................................... 192

4.5.1 挂图作战........................................................................... 193

4.5.2 生态全景图....................................................................... 193

4.5.3 蓝天保卫战....................................................................... 193

4.5.4 碧水保卫战....................................................................... 193

4.5.5 净土保卫战....................................................................... 194

第5页

石家庄市生态环境综合管理平台项目

IV

4.5.6 污染源监管....................................................................... 194

4.5.7 自然生态........................................................................... 194

4.5.8 督查执法........................................................................... 194

4.5.9 数据资产分析................................................................... 195

成效分析 ...................................................................................... 196

5.1 经济效益分析.............................................................................. 196

5.2 社会效益分析.............................................................................. 197

5.3 环境效益分析.............................................................................. 198

项目成本估算 .............................................................................. 199

第6页

项目概述

1.1 项目背景

深入贯彻落实习近平生态文明思想,立足新发展阶段,完整、准确、

全面贯彻新发展理念,积极服务高质量发展,深入打好污染防治攻坚战,

坚持精准治污、科学治污、依法治污,推动新一代信息化技术与生态环境

管理深度融合,2021 年 9 月 15 日中共河北省生态环境厅党组,印发《河

北省智慧环保体系建设实施方案》的通知(冀环党组〔2021〕153 号),

要求将数据管理贯彻于生态环境管理的全过程、覆盖到生态环境工作的各

方面,全面整合数据资源,实行统一集中管理,拓展应用范围深度,充分

发挥数据的边际效应,不断提高智慧化水平,彻底改变传统的管理和治理

方式,建设全国最先进的智慧环保体系。

为落实党中央、国务院、省委、省政府关于加强生态环境保护工作的

系列部署和要求,加快石家庄生态环境信息化建设,实现生态环境管理的

现代化、科学化、信息化,助力社会经济高质量发展。需加快推进石家庄

市生态环境综合管理平台建设,全面提升智能监管能力、数据整合能力、

大数据分析能力、指挥调度能力、决策支撑能力,实现生态环境监管全要

素数据分析、全方位智能监控、全环节监督执法、全时段预警防控,有效

提升全市生态环境治理能力现代化水平。

1.2 现状分析

全市生态环境系统建设存在管理水平不高、发展不平衡、标准不统一、

系统不联通、监管不协同,数据孤岛现象普遍存在,利用互联网等新技术

手段不够,数据归集共享不畅等问题,生态环境领域信息化总体上处于起

第7页

石家庄市生态环境综合管理平台项目

2

步阶段。现有的信息化系统比较分散,缺乏统一整合,无法满足统筹管理、

全局掌控生态环境信息的需要。

1、数据资产缺统一归集

现阶段石家庄市生态环境信息化健全欠缺统一化的模式,针对数据的

采集、整合、利用以及共享等各个方面都欠缺统一且可行的规定以及标准。

造成各业务系统间的数据壁垒。

2、决策管理缺智能分析

目前石家庄市环境监管方式单一,无法对环境污染做出及时预警;无

法结合当前环境态势,预测未来环境变化情况,实现精准治理及可视化直

观展现环境质量底数信息。

3、环境治理缺精细监管

随着石家庄人口增长和现代工业的发展,向环境中排放的有害物质大

量增加,环境质量逐步恶化,导致大气污染严重。目前,石家庄市对污染

防治重点任务调度管理、空气质量达标考核等相关机制建设不完善,且大

数据分析技术对监测数据情况统计分析不全面,对超出标准或合理阈值的

监测数据不能及时告警。在环境治理方面,缺乏大气、污染源等业务精细

化监管。

4、系统建设缺顶层规划

现阶段石家庄市生态环境的信息数据复杂且多样,数据传输系统存在

差异性,欠缺统筹协调,各个系统独立运行且来源复杂,整体缺乏顶层规

划设计和大系统建设思路,各系统间业务协同联动和数据共享性较差,导

致“信息孤岛”、“数据烟囱”。

第8页

石家庄市生态环境综合管理平台项目

3

1.3 建设目标

以学习贯彻党的十九大和习近平总书记重要讲话精神,落实省委省政

府打赢污染防治攻坚战的目标要求,实现生态环境持续改善的目标;贯彻

落实国家“互联网+监管”系列部署,以“加快改善生态环境质量,坚决打好

污染防治攻坚战,提升全市生态文明水平”为总体目标,全面建设石家庄

市生态环境综合管理平台项目,构建“1+1+3 生态环境管理体系”,即通过

1 个全市生态环境数据资源中心、1 个生态环境大数据决策分析平台结合

2 大支撑应用(业务监管精细化应用、业务协同调度中心)及移动端的建

设实现对生态环境的统一监测、精准监管,做到以数据感知监测、以数据

驱动监管、以数据推动污控、以数据支撑防治。为生态环境治理提供现代

化手段,用信息化武装生态环境执法队伍,用信息支撑环境管理,提升全

市生态环境建设水平,建设新时代经济强省、美丽石家庄。

1.3.1 “一中心”实现数据融合

坚持创新、协调、绿色、开放、共享的五大发展理念,以“数据融合、

信息共享、业务协同、智能服务”为指导,推进技术融合、业务融合、数

据融合,构建“横向到边、纵向到底”数据交换共享体系,形成向平台直

接获取为主、部门间数据交换获取为辅的数据共享机制,纵向向上打通生

态环境厅、向下穿透至县(区),横向汇聚相关委办局,统筹整合内外部

数据,制定数据资源共享管理办法,编制数据资源共享目录,重点推动生

态环境质量、环境监管、环境执法、环境应急等数据共享。推动生态环境

数据资源全面整合共享,提高数据共享的管理和服务水平。

第9页

石家庄市生态环境综合管理平台项目

4

1.3.2 “一幅图”提供决策支撑

加强大数据创新决策应用,将大数据作为支撑生态环境管理科学决策

的重要手段,利用跨部门、跨区域的生态环境数据资源,基于各类数据分

析模型,加强生态环境质量、污染源、环境承载力等数据的关联分析和综

合研判,建立全景式生态环境形势研判模式,支撑环境形势综合研判、环

境政策措施制定、环境风险预测预警,做到定量化、可视化实施成效评估,

促进环境管理模式创新。实现“用数据说话,用数智决策”,全面提升环

境管理和科学决策能力。

1.3.3 “两应用”助力精准治理

为全面准确掌握全市大气环境监测、水环境监测等环境质量监测情况,

需整合现有生态环境信息化系统,构建环境管理闭环,配套相应的系统建

设,实现管理流程在部门间无缝衔接,促进各部门任务及时响应。并完善

重点区域周边精细化管控机制,动态监测重点减排企业,摸清污染源底数,

分区分级分行业精准治理,全面提升环境质量监测全面化水平。

1.4 建设依据

1.4.1 政策依据

➢ 《关于印发<河北省生态环境监测网络建设实施方案>的通知》

(冀政办字〔2015〕170 号)

➢ 《关于印发政务信息资源共享管理暂行办法的通知》(国发〔2016〕

51 号)

➢ 《关于印发<生态环境大数据建设总体方案>的通知》(环办局

第10页

石家庄市生态环境综合管理平台项目

5

〔2016〕23 号)

➢ 《关于深化环境监测改革提高环境监测数据质量的意见》(局字

〔2017〕35 号)

➢ 《关于全面加强生态环境保护坚决打好污染防治攻坚战的意见》

(中发〔2018〕17 号)

➢ 《关于加强生态环境网络安全和信息化工作的指导意见》(环办

局〔2019〕41 号)

➢ 《河北省国民经济和社会发展第十四个五年规划和二 O 三五年远

景目标纲要》

➢ 《河北省智慧环保体系建设实施方案》(冀环党组〔2021〕153 号

1.4.2 技术依据

➢ 《信息技术软件维护》(GB/T 20157-2006)

➢ 《环境信息术语》(HJ/T 416-2007)

➢ 《环境信息分类与代码》(HJ/T 417-2007)

➢ 《信息技术软件生存周期过程》(GB/T 8566-2007)

➢ 《计算机软件测试规范》(GB/T 15532-2008)

➢ 《计算机软件需求规格说明规范》(GB/T 9385-2008)

➢ 《非结构化数据访问接口规范》(GB/T 32908-2016)

➢ 《软件工程国家标准》(GTB856)

➢ 《信息技术安全技术带消息恢复的数字签名方案》(GB/T 15851-

1995)

➢ 《信息安全技术鉴别与授权认证中间件框架与接口规范》(GB/T

第11页

石家庄市生态环境综合管理平台项目

6

30275-2013)

➢ 《环境信息技术安全技术规范》(HJ 729-2014)

➢ 《信息安全技术 网络安全等级保护基本要求 第 2 部分:云计算

安全扩展要求》(GA/T 1390.2-2017)

➢ 《信息安全技术 网络安全等级保护基本要求》(GB/T 22239-2019)

➢ 《信息安全技术 网络安全等级保护测评要求》(GB/T 28448-2019)

➢ 《信息安全技术 网络安全等级保护安全设计技术要求》(GB/T

25070-2019)

第12页

石家庄市生态环境综合管理平台项目

7

需求分析

2.1 推进生态环境数据汇聚融合

构建“横向到边、纵向到底”数据交换共享体系,形成向平台直接获

取为主、部门间数据交换获取为辅的数据共享机制,纵向向上打通生态环

境厅、向下穿透至县(区),横向汇聚相关委办局,统筹整合内外部数据,

制定数据资源共享管理办法,编制数据资源共享目录,重点推动生态环境

质量、环境监管、环境执法、环境应急等数据共享。

2.2 提升生态环境科学决策能力

以促进石家庄生态环境高效监管为目标,建生态环境决策分析应用,

利用监管数据资源,加强污染源、污染物等数据的关联分析,支撑区域化

环境管理与创新,实现可靠监管、有效预测,实现环境监管部门“用数据

说话、用数据管理、用数据决策”推动监察管理创新,加速环境监管中各

类问题的有效解决,推动由经验判断向科学决策转变,整体提升科学决策

水平。

2.3 提升生态环境精细化管理能力

围绕生态环境业务监管场景,构建基于一张地图的生态环境监管业务

应用,推动全市生态环境保护业务协同联动。坚持目标管理导向,为市、

县大气环境业务领域的各级领导、工作人员提供大气环境涉及的空气环境

质量等各类大气生态环境数据的空间关联、展示和查询,消除数据孤岛现

象,提高大气环境精细化管理能力。

第13页

石家庄市生态环境综合管理平台项目

8

2.4 整合生态环境现有业务系统

对现有各类信息化应用进行整合,实现现有系统在入口、登录、数据

层面的整合。消除信息化“孤岛”问题增强业务部门内部业务协同。对各

业务部门现有内部业务流程进行梳理,构建环境管理闭环。整合石家庄市

生态环境局现有信息化系统,汇聚环境监控数据,提供企业违法违规行为

预警预报能力,有力支撑生态环境精细化管理,全面推动污染源协同监管,

提升综合执法能力。

第14页

石家庄市生态环境综合管理平台项目

9

总体规划方案

3.1 建设原则

3.1.1 坚持急用先行、分步实施推广

按照生态环境部关于生态环境信息化建设的要求,结合石家庄市自身

业务特点和实际情况,对业务应用进行评估,按照急用先行的原则进行建

设,即重要的、紧急的业务应用先建设应用,并按照业务的重要性划分阶

段进行分步实施推广,力争项目有序、稳定推进,确保项目按期完成建设

并进入运行期,真正为生态环境监管发挥实质性作用。

3.1.2 坚持立足现有、逐步优化完善

立足石家庄市现有生态环境信息化成果,通过统一标准规范、业务流

程梳理、系统整合集成等,逐步实现全市生态环境信息资源统一汇聚、分

析应用和深度服务。

3.1.3 坚持统一标准、支撑协同联动

统一标准、统一平台是多方系统互连互通、信息共享、业务协同的基

础,是石家庄市生态环境综合管理平台成功建设的重要保障。搞好标准化,

可以加快生态环境信息化发展,提高项目质量,保障工作效率,支撑业务

应用系统建设,促进业务协同联动发展。

3.1.4 坚持问题导向、强化测管协同

根据环境管理工作面临的重点问题,梳理尚未解决的生态环境信息化

难题,抓住核心问题,采用新技术、新手段,以解决突出问题和输出有效

第15页

石家庄市生态环境综合管理平台项目

10

结果为导向,对症施策,贯彻落实生态环境制度改革,聚焦生态环境问题

和管理难点,探索以信息化创新生态环境管理新模式,强化系统互联互通,

推动测管业务协同,提高生态环境管理水平。

3.1.5 坚持互联互通、推动共享开放

围绕生态环境保护业务主线,统筹全市生态环境信息资源,形成纵向

贯通省、市、县,横向连接委办局和互联网数据的生态环境资源体系,推

动全市生态环境数据共享开放,提升数据价值服务能力。

3.2 总体设计

3.2.1 总体架构

总体架构图

本次石家庄市生态环境综合管理平台设计总体架构从下到上分别包

括基础层、数据层、支撑层、应用层,标准规范体系和安全保障体系作为

平台稳定运行的规范和保障,同时增加运行维护体系,提升平台统一运维

管理能力。

基础层:基础层包括云计算资源、云存储资源、云安全资源、网络资

第16页

石家庄市生态环境综合管理平台项目

11

源,通过基础设施来支持数据层和应用层,通过统一安全、统一运维、数

据备份等服务能力,为石家庄市生态环境综合管理平台提供平稳运行基础

软硬件支撑环境。

数据层:提供数据汇聚、数据处理、数据存储、数据治理、数据服务

等基础功能,实现生态环境信息资源汇聚共享,为业务应用提供数据支撑

服务。

支撑层:系统通过数据交换服务、地理信息服务、统一身份认证管服

务、统一支撑组件服务,保障石家庄市生态环境综合管理平台稳定高效运

行。

应用层:石家庄市生态环境综合管理平台的建设内容包括:业务监管

精细化应用、业务协同调度中心、生态环境大数据决策分析、生态环境移

动端 4 个部分。

标准规范体系:完善健全石家庄市生态环境综合管理平台标准规范体

系,实现科学合理、先进务实的管控目标,为整个项目提供建设规范化依

据,主要包括管理标准规范、信息资源标准规范、共享交换标准规范、开

发标准规范、网络标准规范、信息安全标准规范、运维服务标准规范等。

安全保障体系:依据国际标准、国家标准和行业标准,从物理安全、

网络安全、系统安全、应用程序安全、数据资源、云计算安全、移动互联

安全等安全技术和安全管理(安全制度、机构、人员)方面入手,建设完

善安全保障体系,全面提升平台安全防护水平和保障能力。

运维保障体系:依据 ITIL 和 ITSS 标准体系,为石家庄市生态环境综合

管理平台打造一套科学严谨的运维保障体系,通过运维管理流程、运行管

第17页

石家庄市生态环境综合管理平台项目

12

理制度、运维管理系统等,实现对服务队伍、服务资源、服务技术、平台

资产、服务边界、服务评价等方面的制定相应的管理流程、管理制度和办

法,保障平台的稳定运行。

3.2.2 技术路线

3.2.2.1 GIS 技术

地理信息系统又称为“地学信息系统”,它是一种特定的十分重要的

空间信息系统。在计算机硬、软件系统支持下,对整个或部分地球表层(包

括大气层)空间中的有关地理分布数据进行采集、储存、管理、运算、分

析、显示和描述的技术系统。地理信息系统具有数据输入、预处理功能、

数据编辑功能、数据存储与管理功能、数据查询与检索功能、数据分析功

能、数据显示与结果输出功能、数据更新功能等。通俗地讲,地理信息系

统是信息的“大管家”。地理信息系统一般由计算机、地理信息系统软件、

空间数据库、分析应用模型图形用户界面及系统人员组成。

3.2.2.2 搜索引擎技术

搜索引擎,是指根据一定的策略、运用特定的计算机程序从互联网上

搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检

索相关的信息展示给用户的系统。全文搜索引擎是目前广泛应用的主流搜

索引擎。它的工作原理是计算机索引程序通过扫描文章中的每一个词,对

每一个词建立一个索引,指明该词在文章中出现的次数和位置,当用户查

询时,检索程序就根据事先建立的索引进行查找,并将查找的结果反馈给

用户的检索方式。这个过程类似于通过字典中的检索字表查字的过程。

第18页

石家庄市生态环境综合管理平台项目

13

3.2.2.3 区块链技术

区块链技术,被称之为分布式账本技术,是一种互联网数据库技术,

其特点是去中心化、公开透明,让每个人均可参与数据库记录。狭义来讲,

区块链是一种按照时间顺序将数据区块以顺序相连的方式组合成的一种

链式数据结构, 并以密码学方式保证的不可篡改和不可伪造的分布式账

本。广义来讲,区块链技术是利用块链式数据结构来验证与存储数据、利

用分布式节点共识算法来生成和更新数据、利用密码学的方式保证数据传

输和访问的安全、利用由自动化脚本代码组成的智能合约来编程和操作数

据的一种全新的分布式基础架构与计算方式 。

3.2.2.4 图数据库技术

图形数据库是 NoSQL 数据库的一种类型,它应用图形理论存储实体

之间的关系信息。图形数据库是一种非关系型数据库,它应用图形理论存

储实体之间的关系信息。最常见例子就是社会网络中人与人之间的关系。

关系型数据库用于存储“关系型”数据的效果并不好,其查询复杂、缓慢、

超出预期,而图形数据库的独特设计恰恰弥补了这个缺陷。

在一个图形数据库中,最主要的组成有两种,结点集和连接结点的关

系(有的也称泡泡和箭头)。结点集就是图中一系列结点的集合,比较接

近于关系数据库中所最常使用的表,而关系则是图形数据库所特有的组成。

Neo4j 是一个高性能的 NOSQL 图形数据库,它将结构化数据存储在网

络上形成图谱而不是表中。Neo4j 也可以被看作是一个高性能的图引擎,

该引擎具有成熟数据库的所有特性,如:事务,索引等。程序员工作在一

个面向对象的、灵活的网络结构下而不是严格、静态的表中,但是他们可

第19页

石家庄市生态环境综合管理平台项目

14

以享受到具备完全的事务特性、企业级的数据库的所有好处。

3.2.2.5 大数据数据处理技术

大数据数据处理主要包括:数据挖掘技术、数据预处理技术、数据压

缩技术及数据存储技术。数据挖掘方法有分类、回归分析、聚类、关联规

则、神经网络方法、Web 数据挖掘等。数据预处理不仅保证了挖掘数据的

正确性和有效性,而且通过对数据格式和内容的调整,使数据更符合挖掘

的需要,即清除与数据分析、挖掘无关的项,给挖掘算法提供更高质量的

数据。数据归约是对数据处理的技术,如数据立方体聚集、维归约、数据

压缩、数值归约和离散化都可以用来得到数据的归约表示,而使得信息内

容的损失最小。数据压缩技术,就是用最少的数码来表示信号的技术,降

低和治理海量数据的蔓延式增长也是需要面对的挑战,用最少的数码来表

示信号。数据压缩从对原始数据信息保留程度的角度可分为两种:无损压

缩和有损压缩,可以有效的减少数据对存储的需求,降低成本。数据存储

技术也包括:开发新型数据库技术、对海量数据进行分区操作、编写优良

的程序代码、建立广泛的索引、加大虚拟内存、建立缓存机制、使用临时

表和中间表、使用文本格式进行处理、使用文本格式进行处理、优化查询

SQL 语句、使用数据仓库和多维数据库存储等。

第20页

石家庄市生态环境综合管理平台项目

15

建设内容

4.1 生态环境数据资源中心

4.1.1 信息资源规划

信息资源是生态环境保护和污染防治的重要资产之一,是推动生态产

业大力发展的重要战略资源。大数据时代,通过对信息资源的科学整合与

综合管理,研究信息资源在生产经营活动中被开发利用的规律,形成大数

据信息资产,构建“生态环境”数据资源体系,覆盖全市各级生态环境部

门,提高数据资源的全面性、完整性、一致性、准确性、时效性,提升数

据资源的权威性和可用性,作为全市“生态环境”数据的统一接口,汇集

所有相关数据并为各类应用系统提供数据资源,实现功能域的确定、数据

域的确定、生态环境对象类的划分、对象编码规则定义、数据字典编制,

为生态环境质量追根溯源、全面加强生态环境保护、开展有针对性的治理

提供有力的数据支撑。

4.1.1.1 信息资源规划目的

信息资源规划的目的是对生态环境监测监管涉及的数据进行信息资

源梳理,从数据产生、获取,到处理、存储、传输及利用进行全面的规划。

规划的数据将统一由数据资源中心进行存储和管理。

通过统一信息资源规划、有效整合环境相关数据,建立起信息资源目

录,在使用者和各部门之间搭建起一个桥梁和纽带,建立共享信息组织和

服务基础框架,在此框架中规定共享信息描述标准,实现共享数据描述信

息采集和发布、共享数据获取功能和流程,生态环境系统内各级信息提供

者根据标准要求准备共享信息,通过信息资源目录提供的功能编目和发布

第21页

石家庄市生态环境综合管理平台项目

16

共享元数据信息,这些信息以目录的形式进行聚合和组织,形成多角度、

多层次的信息资源共享体系,各级信息使用者通过信息资源目录,检索所

需的共享数据描述信息,并通过相关流程获取实际的数据,为提升环境保

护信息化水平奠定坚实的信息资源基础。

4.1.1.1.1 信息资源规划内容

4.1.1.1.1.1 信息资源分类

4.1.1.1.1.1.1 环境信息分类规范

依据生态环境部环境信息分类与代码分类标准,环境信息资源初步划

分为 6 大类,分别为:环境质量信息、生态环境信息、污染源信息、环境

管理业务信息、环境政务管理信息、环境政策法规标准。

4.1.1.1.1.1.2 环境信息分类方法

生态环境信息数据建立在环境信息分类之下,需兼顾石家庄市生态环

境局已有业务信息资源现状、阶段业务信息资源建设目标以及长远建设需

求,能够快速定位目标数据资源。单纯地在环境信息分类基础上的线分类

法会造成生态环境信息数据层级不清晰、检索困难,单纯面分类法使环境

元数据在环境信息分类下的分类设定难度增高。综合数据中心资源目录建

设目标,生态环境信息资源目录使用线分法、面分法的组合方式。

4.1.1.1.1.1.3 环境信息分类内容

根据市生态环境业务需求,结合国家生态环境部环境信息分类与代码

分类标准,生态环境信息分为环境质量信息、污染源信息、生态环境信息、

环境管理业务信息、环境政务管理信息、环境政策法规标准 6 大类。

4.1.1.1.1.2 信息资源目录编码

4.1.1.1.1.2.1 编码原则

1、科学性原则:按照决定信息资源的存储方式、读取方式以及信息

资源对应的数据清洗、展现的应用过程的需要和习惯。

第22页

石家庄市生态环境综合管理平台项目

17

2、系统性原则:将业务系统信息资源数据与数据中心清洗后的标准

数据按一定排列顺序予以分类以及系统化,并形成一个科学的分类体系。

3、可扩展性原则:环境数据资源在迅速增加的情况下需兼顾信息资

源分类和信息资源数据量的增加情况,同时需要适应较慢的分类扩展情况

以及快速增加的资源扩展情况。

4、兼容性原则:充分研究市生态环境信息资源目录标准与环境信息

的国家标准、生态环境部标准、行业标准和现行系统情况,与已有相关标

准一致。

4.1.1.1.1.2.2 编码方式

为实现市生态环境信息资源的统一管理以及信息资源的唯一编码,参

照《政务信息资源目录编制指南(试行)》标准编码方法,对信息资源目录

编码创建了“上四下三”的组合编码方式,上四级分为大类编码、中类编

码、小类编码、子类编码,下三级对应环境信息数据源类目编码、环境信

息数据资源类 S 编码、环境信息数据编码。

“上四下三”的目录编码结构是通过对环境信息数据源系统、标准数

据的分类实现第一层数据分域,通过对数据资源与元数据资源分类实现第

二级目录编制,通过直接定义数据信息资源实现第三级目录编制。该种编

码是库级数据信息分类结构,结合环境信息的元数据管理方法对环境信息

表级、字段级的数据进行分类,实现了生态环境信息分类的全覆盖。市生

态环境信息资源目录部分以元数据为中心,实现了环境信息数据的增加、

修改不影响资源目录的调整,从而大大降低了环境信息资源目录的更新频

率。

第23页

石家庄市生态环境综合管理平台项目

18

4.1.1.1.2 信息资源规划成果

4.1.1.1.2.1 数据标准规范

遵循统一的标准规范体系,其中数据标准规范包括数据采集标准、存

储标准、校核标准、传输标准和应用标准等内容。

4.1.1.1.2.2 元数据管理机制

4.1.1.1.2.2.1 元数据采集

元数据(Metadata)是描述其它数据的数据,或者说是用于提供某种

资源的有关信息的结构数据。元数据是描述数据资源或数据等对象的数据,

其使用目的在于:识别资源;评价资源;追踪资源在使用过程中的变化;

实现简单高效地管理大量网络化数据;实现信息资源的有效发现、查找、

一体化组织和对使用资源的有效管理。

借助元数据,用户可以采集、组织、识别、定位、发现、评估和选择

信息资源,实现简单、高效地检索、交换、管理海量数字化信息资源。运

用 XML 标识语言,通过元数据与分类表、主题词表的结合,组织信息资源

分类目录、主题目录和其他目录,实现对数字资源的导航、检索、定位和

交换服务。

元数据扩展

信息资源目录元数据模型主要用来支持对资源的检索,通过信息资源

目录的方式进行发布,因此典型的元数据模型是一个树形结构,按照不同

信息资源分类形式对数据集进行组织,形成多个信息组织树,实现多角度

的数据资源展现。

信息资源目录元数据组织模型中各类表存储信息如下:

1、元数据标准信息:存储元数据标准的一些基本信息,如:标准名

称、版本等。

第24页

石家庄市生态环境综合管理平台项目

19

2、元数据标准模式:记录元数据结构/模式信息,即 XML Schema 文

本。

3、元数据元素:以元数据元素为单位存储元数据记录,包括一个元

数据元素的 XML 标记/相应的元素值等。

4、元数据记录:以元数据全文为单位存储元数据记录,元数据的 XML

文本被存储于一个字段中。

5、元数据库信息:存储元数据库的基本信息,包括元数据库的名称、

标识等内容。

在数据库实施过程中,可以根据实际需要对信息资源目录元数据标准

进行扩展以形成各业务数据的元数据应用方案。

元数据特征

元数据的基本特点主要有:

1、元数据一经建立,便可共享。元数据的结构和完整性依赖于信息

资源的价值和使用环境;元数据的开发与利用环境往往是一个变化的分布

式环境;任何一种格式都不可能完全满足不同团体的不同需要;

2、元数据首先是一种编码体系。元数据是用来描述数字化信息资源,

这导致了元数据和传统数据编码体系的根本区别;元数据的最为重要的特

征和功能是为数字化信息资源建立一种机器可理解框架。

3、元数据体系构建了信息资源目录的逻辑框架和基本模型,如果提

供数据元的组织同时提供描述数据元的元数据,将会使数据元的使用变得

准确而高效。用户在使用数据时可以首先查看其元数据以便能够获取自己

所需的信息。元数据可通过抽取、著录等方式进行生成,通过审核之后,

第25页

石家庄市生态环境综合管理平台项目

20

发布入库。

元数据组成

从组成上来说,元数据的主要内容包括信息资源的标识、内容、分发、

数据质量、数据表现、数据模式、图示表达、限制和维护等信息。

1、元数据标识

标识是信息资源的一个重要特征,包括信息资源的唯一标识符、信息

资源的摘要信息、创建信息资源的目的、信息资源的状态等信息。

2、元数据内容

内容重点描述信息资源的基本数据组成,包括信息资源包含哪些具体

的数据。

3、元数据分发

分发着重说明使用者如何获得信息资源的信息,包括数据分发格式信

息、分发者信息以及用户获取数据集的途径。

4、元数据质量

数据质量信息包含数据日志信息以及数据质量报告等内容,数据日志

说明的是信息资源的生产依据和过程,数据质量报告给出了按特定的数据

生产标准进行评价的结果。

5、元数据表现

数据表现确定了数据的展现方式,包括图形、影像、文字等方式的说

明。

6、元数据模式

数据模式信息包含有关数据的物理模式信息。

第26页

石家庄市生态环境综合管理平台项目

21

7、元数据图示表达

图示表达则进一步说明了采用图形进行数据表达的具体规则。

8、元数据限制和维护信息

限制和维护信息既包括信息资源本身也包括元数据的使用以及日常

维护方面的信息。元数据的具体组成将根据信息资源具体情况进行确定。

生态环境信息资源元数据的定义为描述生态环境信息资源特征的数据,元

数据的基本单元为元数据元素,用以描述生态环境信息资源的某个特性,

一组说明生态环境信息资源相关特性的元数据元素称为元数据实体。

元数据采集内容

在已有信息资源的基础上,按照不同信息源的元数据要求,采集元数

据。

1、数据源

数据源为集成到数据中心的各类共享数据,包括污染源数据、环境质

量数据、核与辐射数据、应急管理数据、环境管理数据、生态环境数据、

环境空间数据、文档数据、环境统计数据、污染源普查数据等。

2、元数据提取内容

根据国家生态环境信息资源目录要求,结合各业务数据实际情况,进

行元数据的提取,包括公共资源核心元数据和交换服务核心元数据。

公共资源核心元数据包括:资源名称、资源负责方、资源格式信息、

关键字说明、时间范围、资源分类、元数据联系方。

交换服务核心元数据由元数据实体和元数据元素组成,包括部门名称、

部门组成、交换服务标识、交换服务名称、服务类型、服务访问地址、服

第27页

石家庄市生态环境综合管理平台项目

22

务共享元素名称等内容。

4.1.1.1.2.2.2 元数据管理设计

为用户提供高质量、准确、易于管理的数据,它贯穿数据资源中心构

建、运行和维护的整个生命周期。元数据管理需要建设元模型管理、元数

据管理及维护、导入导出、获取接口、流程跟踪、元数据分析、血缘分析

等功能,依据信息资源目录进行元数据管理。

元数据管理需要在元模型规范的基础上进行建设,通过元数据的管理

来保证所有业务系统与数据资源中心的数据标准的一致性。通过设定元数

据管理范围,通过 ETL 工具等方式获取元数据,在元数据模型的基础上,

根据不同数据的特点和数据共享应用的需要,完成元数据库结构设计,建

立元数据库体系。

元数据库逻辑模型建立

信息资源目录元数据库包括专题、主题词库、元数据信息、元数据类

型、单行文本定义、多行文本定义、字段定义、数字、数据来源、日期定

义、视图、计算值、资源分类、超链接或图片、选项定义、验证规则字典

等描述结构化数据的元数据对象的属性表。

元数据库表结构设计

元数据数据库表结构设计包括:元数据信息的表结构、元数据类型的

表结构、数据来源的表结构、视图的表结构、资源分类的表结构。

1、元数据信息的表结构

元数据信息表主要用于管理元数据的信息,主要信息包括名称、标识、

摘要、主题词(关键字)、创建日期、发布日期等。

第28页

石家庄市生态环境综合管理平台项目

23

2、 元数据类型的表结构

元数据类型表主要用于管理元数据类型的信息,主要信息包括元数据

种类编码、名称、序号、状态(暂存,提交,退回,发布,删除)等。

3、 元数据来源的表结构

数据来源表主要用于管理所有数据来源的基本信息,主要信息包括数

据来源名称、编码、类型(静态,动态)、说明、数据源连接字符串值

(ConnectionString)、数据源分组名称等。

4、 视图的表结构

视图表主要用来管理视图的相关基本信息,主要包括视图名称、元数

据种类编码、元数据_ID、数据源分组名称、所有者(创建者,公共)、

主排序字段、次排序字段、过滤条件表达式、分组表达式等。

5、 资源分类的表结构

资源分类表主要用于管理资源的分类信息,主要信息包括分类编码、

元数据_ID、分类名称、上级分类等。

4.1.1.1.2.3 信息分类管理

通过对生态环境信息资源进行编目、编码配置、质量管理、共享管理

等实现对生态环境数据资源目录的管理。

4.1.1.1.2.4 数据字典

数据字典管理是数据字典的建立,其主要目的是为数据管理、开发和

使用人员提供有关数据的来源、说明、格式和与其他数据的关系等信息描

述。在生态环境数据中心建设过程中,各系统的建设都要遵循此数据字典

的标准。

数据字典是信息资源目录的重要组成部门,数据自动能够实现数据库

第29页

石家庄市生态环境综合管理平台项目

24

标准化建设,对庞大的环境信息资源数据进行有效的管理。

由于各个数据库对象组织和构建方式各不相同,因此其描述信息存在

较大的差别,同时数据库对象之间有的存在关联关系,有的则是相互孤立

的。数据字典中,对每类数据库对象描述信息分别用单独的表进行存储,

各表之间根据数据库对象之间的构成关系建立关联。

4.1.1.1.2.4.1 数据字典元数据库逻辑模型

根据以上原则和方法,并兼顾元数据管理功能,制定信息资源目录元

数据库。数据字典元数据库包括信息系统、服务器、数据源、数据库、数

据表、字段、表关系、关联字段表、数量单位分类、数量单位表、域定义、

域值、元数据类型、类型值、元数据项备注等描述结构化数据的元数据对

象的属性表,其中元数据备注表可以统一的描述所有数据库元数据对象的

备注属性。

4.1.1.1.2.4.2 数据字典元数据存储设计

数据字典元数据库建议采用关系型数据库的存储方式。数据字典中,

对每类数据库对象描述信息分别用单独的表进行存储,各表之间根据数据

库对象之间的构成关系建立关联。因此,数据字典也是以数据表和视图为

主要存在形式的。

4.1.1.1.2.4.3 数据字典元数据的访问技术设计

数据字典是指对数据的数据项、数据结构、数据流、数据存储、处理

逻辑等进行定义和描述。比如一个表的创建者信息,创建时间信息,所属

表空间信息,用户访问权限信息等。当用户在对数据库中的数据进行操作

时遇到困难就可以访问数据字典来查看详细的信息。数据字典有静态和动

态之分。静态数据字典主要是在用户访问数据字典时不会发生改变,但动

第30页

石家庄市生态环境综合管理平台项目

25

态数据字典是依赖数据库运行的性能,反映数据库运行的一些内在信息,

所以在访问这类数据字典时往往不是一成不变的。以下分别就这两类数据

字典来说明数据字典的访问技术。

1、静态数据字典

这类数据字典主要是由表和视图组成,应该注意的是,数据字典中的

表是不能直接被访问的,但是可以访问数据字典中的视图。

2、动态数据字典

数据库包含了一些潜在的由系统管理员维护的表和视图,由于当数据

库运行的时候它们会不断进行更新,所以称它们为动态数据字典(或者是

动态性能视图)。这些视图提供了关于内存和磁盘的运行情况,所以只能

对其进行只读。

4.1.1.2 数据体系建设

根据平台建设目标,通过对生态环境数据不同维度的梳理分类,对不

同来源的数据采集、加工、处理,从业务、范围、结构、管理等方面形成

完整的数据体系。为生态环境业务管理、生态环境评价及决策分析提供数

据支撑。

4.1.1.2.1 数据分类体系

为了便于对各类数据的管理、共享和综合应用,对业务数据的组织及

应用不以业务或者采集方式、频率为单位,而是围绕工作核心,分析影响

工作的主要因素,通过对这些因素分类归纳,形成一套比较全面的分层次

信息分类,进而细化为具体的指标,通过指标将分散的数据转化为具有时

间序列化、涵义统一的信息,基于指标对各类数据进行组织,形成反映相

第31页

石家庄市生态环境综合管理平台项目

26

关情况的统一数据主题视图,作为共享和应用的基础,进而为目标的制定

提供信息支持。

信息资源规划是战略布局,是前瞻性工作,本设计的数据分类则是在

战术层面对由于缺乏规划而造成的问题提出的修补措施。

可参考的数据分类方式主要包括:

1、按照数据来源:划分为环境系统内部数据和外部数据,内部数据

包括污染源管理、环境质量、督察执法以及应急管理等内容,外部数据包

括企业信息、法人信息、城市建设项目等与生态环境相关的信息。

2、按照服务范围:划分为业务数据和辅助数据,业务数据由不同的

业务管理流程(监测、监督、统计等)产生,反映了业务管理的情况,辅

助性数据用来为业务数据的应用提供多元化的支持,例如空间数据、公共

编码数据等。

3、按照数据类型:划分为结构化数据、非结构化数据、半结构化数

据和时序数据。结构化数据能够用统一的结构加以表示和存储,如统计数

据,业务管理数据;非结构化数据无法用数字或统一的结构表示,如文档、

图像、声音等;半结构化数据多来自互联网抓取;时序数据具有很强的时

间序列的特点,实时性要求较高。根据不同的数据类型,存储和管理的模

式存在较大差别,需要在数据库体系设计中分别考虑。

4.1.1.2.2 环境内部数据分类体系设计

针对环境内部数据进行环境内部数据分类体系进行设计,环境内部数

据来源于相关的环境管理业务,分为两大类,一类是基础业务数据,另一

类是主题数据。

第32页

石家庄市生态环境综合管理平台项目

27

基础业务数据一般都是分散的,反映某一业务管理领域的问题,需要

进行加工和整合,实现数据的标准化,解决数据统计口径不一致、一数多

源、冲突和冗余问题,提高数据的准确性、可靠性、一致性和可用性,提

供唯一真实可信的数据视图。

1、环境质量管理数据

环境质量管理数据包括环境质量监测数据、环境评价数据等。环境质

量数据包括:水环境质量的在线监测和手工监测、空气环境质量及噪声环

境质量的在线监测和手工监测等。

4.1.1.2.3 环境外部数据分类体系设计

环境外部数据包括委办局环境相关数据以及互联网公开数据。获取的

委办局数据包括:气象、林业林草、农业农村、自然资源、住房城乡建设、

交通运输、市场监管、税务、卫生等部门和单位的数据。互联网数据主要

包括生态环境相关公开数据及环境舆情数据。

4.1.1.3 数据库体系建设

通过采用统一的数据标准对内部数据、生态环境部数据、委办局数据、

互联网等数据进行采集、交换、整合。形成不同来源的结构化数据、半结

构化数据、非结构化数据的统一管理。在交换整合的基础数据基础上,通

过人工智能、大数据及业务模型技术进行分析计算,形成供决策评价的生

态环境主题数据。按业务分类维度及数据结构维度,建设不同生态环境业

务功能的数据库,形成完整的生态环境数据库体系。

4.1.1.3.1 数据库设计内容

以国家相关信息资源标准规范为设计依据,在已有信息资源库的基础

上,结合本次项目信息资源规划内容,进行数据库的设计,定义数据库、

第33页

石家庄市生态环境综合管理平台项目

28

表结构、数据字段、元数据等内容,为后续项目建设实施提供指导依据。

数据库设计内容主要包括数据中心数据仓库设计、业务应用数据库设计、

核心数据 ER 图设计、核心表设计四部分。

4.1.1.3.1.1 数据中心库设计

本次数据中心数据库设计包括元数据库、基础数据库、监测数据库、

共享交换数据库、模型数据库、主题数据库、业务专题数据库。

4.1.1.3.1.1.1 元数据库

对业务本身及其运行环境的描述及其定义的数据,称之为元数据。元

数据是描述数据的数据。从某种意义上说,业务数据主要用于支持业务系

统应用的数据,而元数据则是信息门户、数据仓库、决策支持等应用所不

可或缺的内容。元数据库用于管理生态环境数据中心产生的元数据,主要

包括生态环境信息资源目录元数据、数据库描述及管理信息元数据。

4.1.1.3.1.1.2 基础数据库

基础数据库存放生态环境数据中心正常运行所需的各类基础信息,主

要包括系统配置信息、空间地理信息。系统配置信息有人员信息、人员权

限信息、部门信息、行政区划代码信息等。空间地理信息有河流编码信息、

遥感影像基础数据信息等。

4.1.1.3.1.1.3 模型数据库

模型数据库主要存储生态环境数据中心应用到的生态环境相关数据

分析模型及模型计算产生的过程数据。主要包括水环境质量模拟模型、水

容量测算模型、污染贡献率计算模型、空气质量预报数值模型、污染来源

解析数值模型、动态污染来源解析模型、传输路径聚类模型、源清单处理

模型等。

第34页

石家庄市生态环境综合管理平台项目

29

4.1.1.3.1.1.4 监测数据库

环境监测数据包括大气环境监测数据、水环境监测数据、土壤监测数

据、噪声监测数据、核与辐射监测数据、污染源监测数据等。

4.1.1.3.1.1.5 主题分析数据库

业务主题数据库存放通过人工智能、大数据分析所产生的各种主题分

析数据,各业务处室等职能单位通过获取这些主题数据做出最终的业务决

策。主题数据有大气环境分析主题数据、水环境分析主题数据、污染源分

析主题数据、土壤环境分析主题数据、风险应急分析主题数据等。

4.1.1.3.1.1.6 共享交换数据库

共享交换数据主要包括三大部分数据:第一部分为生态环境部交换共

享数据,根据生态环境部要求,需要市生态环境局交换到生态环境部需要

的各类监测及相关数据,也需要从生态环境部获取部分生态环境相关数据。

第二部分为委办局数据,例如水利的水质监测数据、河流湖泊基本信息数

据等;林业林草局的森林、草原、自然保护区等基础数据;市场监管局的

企业基本信息数据、法人负责人信息数据等;气象局的气象监测数据;自

然资源的土地利用监测数据等;住建的城市建设相关规划数据、城市环境

基础设施建设明细等信息。第三部分为市生态环境部门的数据,大部分市

生态环境局都有自建系统,产生了一些生态环境管理数据,为了统一管理、

集中决策,需汇聚各市生态环境部门的相关数据。

4.1.1.3.1.1.7 业务专题数据库

数据中心业务专题数据库包括大气环境专题数据库、水环境专题数据

库、应急指挥专题数据库、自然生态专题数据库、土壤环境专题数据库、

固体废物专题数据库、污染源专题数据库、核与辐射专题数据库。业务专

题库主要对应存储从业务应用数据库交换获取的数据。

第35页

石家庄市生态环境综合管理平台项目

30

4.1.2 数据基础平台

4.1.2.1 数据交换系统

生态环境数据交换平台是数据资源中心的中心组成部分,为数据传输

交换提供基础支撑,实现结构化数据、半结构化数据、时序数据、对象数

据等各类数据的高效交换。

4.1.2.1.1 数据交换管理

⚫ 数据交换共享机制

⚫ 交换数据订阅

⚫ 交换数据源管理

⚫ 交换任务管理

⚫ 交换工作流管理

⚫ 交换节点管理

4.1.2.1.2 数据交换配置

数据交换配置主要针对数据应用节点交换的配置管理,通过组件开发

与适配,完成数据自动交换。

⚫ 数据交换流程

⚫ 数据交换配置

⚫ 数据交换适配

4.1.2.1.3 数据交换传输

数据交换传输是数据共享交换平台建设中非常重要和关键的一个技

术,是实现数据信息在各个接入部门、各层级和交换中心之间安全、可靠、

及时、完整的传输交换的基础和重要保证。

数据交换传输提供大数据量传输所需要的各种管理、部署和安全功能,

第36页

石家庄市生态环境综合管理平台项目

31

使其方便易用。只需进行简单的配置就可以轻松实现不同节点间的文件可

靠、安全、高效的传输。提供基于交换任务、交换域的文件到文件、文件

到文件夹、文件夹到文件夹的多排列式交换,支持双向同步交换。

在数据传输过程中对数据包采用多种加密算法,保障数据的安全性。

并且支持文件、数据包、数据流等内容的传输。

⚫ 消息服务总线

⚫ 数据文件传输

⚫ 路由传输

4.1.2.1.4 数据交换监控

数据交换监控完成对交换过程的实时监控,实现对各个交换节点运行

情况、传输节点运行情况、服务器状态、数据库状态的统一监控和统一管

理,能够方便查看数据交换流程执行过程,能够及时掌握节点数据的变更,

保持各个节点数据同步,从而保障数据安全、可靠、可信的交换。

在数据交换流程的执行中难免会出现故障,交换监控管理功能捕捉故

障信息反馈给技术人员,从而保障数据流程的顺利执行。在数据转换中,

如果转换出错,便会出现数据不一致的情况,交换监控对其进行实时监控,

当出现不一致情况时管理人员可以做到及时发现、及时处理。

数据交换监控还对各个节点之间同步的数据进行统计分析,对服务器

状态、磁盘使用情况等进行统计,以图表、列表等形式客观形象的展现出

来。

数据交换监控主要完成了节点监控、流向监控、安全监控、交换量监

控、交换通道监控、传输监控、数据库运行监控、主题监控、适配器监控、

第37页

石家庄市生态环境综合管理平台项目

32

监管预警等。

⚫ 节点监控

⚫ 交换量监控

⚫ 数据库运行监控

⚫ 交换预警

4.1.2.1.5 数据交换对账

在数据交换结束后,根据数据提供方及数据接收方统计的交换数据总

量,是否一致。数据交换后进行总量对账是最基本的数据核对操作,总量

对账可及时发现数据交换过程中由于网络等问题导致的部分数据传输失

败的问题。

4.1.2.2 服务聚合系统

数据共享服务由数据提供方来授权和管理,为方便部门、各系统快速

的进行以服务接口方式共享数据、使用数据以及授权管理,为满足对服务

接口的统一监控管理,平台提供统一的代理以及授权功能,提供稳定高效

的服务接口代理能力。服务聚合平台满足服务聚合管理(服务注册、服务

管理、服务监控、应用管理、组件管理)、服务聚合核心网关(服务鉴权、

服务缓存、服务流控、服务熔断)等功能。

4.1.2.2.1 服务注册

提供服务的注册、测试、发布,实现便捷的日常管理、版本管理,支

持热升级和快速回滚。

4.1.2.2.2 服务管理

提供服务的授权认证管理和服务的限流配置管理。

第38页

石家庄市生态环境综合管理平台项目

33

4.1.2.2.3 服务监控

提供对服务的使用情况、调用情况、熔断情况等进行统一监控,保证

服务在调用过程中的安全和稳定。

4.1.2.2.4 服务鉴权

提供按照服务调用授权信息进行验证,包括授权秘钥和 IP 白名单两

种方式,只有通过授权及 IP 认证的请求才能够访问,保证服务在整个使

用过程中的安全性。

4.1.2.2.5 服务流控

提供为了防止服务雪崩及服务的恶意访问,在服务定义中配置每个应

用的访问次数的功能,对调用流控配置进行监督,如果服务超过流控限制

直接返回拒绝信息。

4.1.2.2.6 服务熔断

提供当服务接口请求超过服务提供的负载时自动断开并按照定义的

规则向请求方反馈异常说明的功能。

4.1.3 数据资源中心

4.1.3.1 数据资源汇聚

基于大数据基础平台提供的存储管理能力,依托大数据资源规划成果,

利用大数据汇聚工具,实现多源异构数据的“一横一纵”全面全量汇聚,

采用整合匹配、多维度融合方法手段,实现基于固定源、水专题、大气专

题、土壤专题、辐射等数据的整合关联,形成专题数据体系。

4.1.3.1.1 数据汇聚筹备管理

4.1.3.1.1.1 数据库及文件创建管理

提供人机交互界面或开发组件,方便数据资源提供方进行数据库创建、

数据表创建、表索引创建、文件夹创建。

第39页

石家庄市生态环境综合管理平台项目

34

4.1.3.1.1.2 存量数据处理

数据提供方将存量数据按数据汇聚标准及代码集标准进行转换处理。

4.1.3.1.1.3 资源管理

数据提供方将待汇聚数据资源进行注册、审核、发布,供资源需求方

通过数据交换体系进行资源汇聚。

4.1.3.1.1.4 资源确认管理

资源需求方通过平台对待汇聚的数据资源进行确认,完成数据汇聚准

备。

4.1.3.1.2 数据汇聚运行管理

4.1.3.1.2.1 数据更新管理

资源提供方在创建数据库表后,按时间增量方式生产业务增量表,同

时将该批次数据增量写入数据对账表。

4.1.3.1.2.2 数据汇聚管理

通过交换管理体系,按需求进行数据交换开发和部署,将数据进行汇

聚、处理、加载入库。数据中心数据汇聚内容包括生态环境部数据、生态

环境局内部数据、委办局数据、物联网监测数据、互联网数据、科研院所

等其他数据。

第40页

石家庄市生态环境综合管理平台项目

35

图 4.1-1 数据汇聚整体逻辑图

1、生态环境部数据汇聚

生态环境部数据包括环境质量监测、污染源、环境政务等数据,汇聚

方式根据需求以前置库方式进行对接汇聚。

2、生态环境局内部数据

生态环境内部数据汇聚数据包括环境质量、污染源、环境政务等相关

数据,主要通过 ETL 工具交换进行数据汇聚。

3、委办局数据汇聚

委办局包括自然资源、交通运输、市场监管、电力、水利、农业农村、

气象等部门外部数据资源,通过前置库方式,利用数据交换平台完成数据

汇聚。

4、物联网监测数据汇聚

物联网数据是指通过各种信息传感设备,产生的海量以时间序列为主

的实时环境监测数据、污染源在线监测等数据,利用 ETL 工具将监测数据

第41页

石家庄市生态环境综合管理平台项目

36

汇聚至数据中心。

5、互联网数据汇聚

互联网数据汇聚主要使用网络爬虫技术实现对生态环境相关数据进

行动态采集,并存储至数据中心。

4.1.3.1.2.3 数据转换管理

将从数据源获取的数据按照业务需求,转换成目的数据源要求的形式,

并对错误、不一致的数据进行清洗和加工。

1、数据补全/空值处理

对于不完整的数据进行过滤,在规定的时间内补全,补全后才进行后

续数据汇聚环节。

2、数据纠正/数据替换

对产生的错误数据提供按规则进行数据纠正的功能。

3、数据去重

针对数据库数据,通常采用列 ID、分组、去重等方法进行处理。针对

非结构化数据通常采用哈希、二进制比较等方法进行处理。

4、数据拆分

将数据按照指定字符进行拆分,从而拆分出相应字段,进行下一步的

处理。

4.1.3.1.2.4 数据对账管理

对汇聚数据进行更新后,按批次将更新量写入对账表,通过对账表比

对批次数据量差异,生成比对报告,若存在数据差异则启动异常处理机制。

4.1.3.1.2.5 异常处理

数据汇聚过程中,发现的异常数据通过数据共享交换体系反馈给数据

第42页

石家庄市生态环境综合管理平台项目

37

提供方,数据提供方接收后,对数据资源进行核对修改,按数据更新重新

提交。

4.1.3.1.3 特殊情况管理

数据汇聚过程中如发生如下情况,需重新组织全量数据更新:

1、平台软件系统升级,业务数据表的唯一标识字段(主键)发生变化;

2、汇聚数据内容不符合数据汇聚标准;

3、汇聚数据内容不符合本文件的代码集标准;

4、增量汇聚机制出现故障,无法继续识别增量数据。

4.1.3.2 数据加工处理

4.1.3.2.1 数据抽取

数据抽取是指从源数据、源系统抽取数据过程。通过数据交换服务,

数据抽取模块依据映射模型配置的抽取规则访问数据源,将数据抽取至内

存、文件(XML、文本文件)或数据流,抽取的内容可以做后续的数据质

量稽核、加工、传输或加载操作。数据抽取方式包括:全量抽取、增量抽

取、文件解析等方式。

4.1.3.2.1.1 全量抽取

全量抽取类似于数据迁移或数据复制,它将数据源中的表或视图的数

据原封不动的从源数据库中抽取出来,转换成数据交换可识别的格式。

4.1.3.2.1.2 增量抽取

增量抽取只抽取自上次抽取以来数据库中要抽取的表中新增或修改

的数据。在数据交换使用过程中,增量抽取较全量抽取应用更广。数据抽

取时,应请注意以下两点要求:

准确性:能够将业务系统中的变化数据按一定的频率准确地捕获到;

第43页

石家庄市生态环境综合管理平台项目

38

性能:不能对业务系统造成太大的压力,影响现有业务。

常用的数据抽取方法如下:

1、时间戳增量数据抽取

它是一种基于快照比较的变化数据捕获方式,在源表上增加一个时间

戳字段,系统中更新修改表数据的时候,同时修改时间戳字段的值。当进

行数据抽取时,通过比较上次抽取时间与时间戳字段的值来决定抽取哪些

数据。有的数据库的时间戳支持自动更新,即表的其它字段的数据发生改

变时,自动更新时间戳字段的值。有的数据库不支持时间戳的自动更新,

这就要求业务系统在更新业务数据时,手工更新时间戳字段。

2、快照增量数据抽取

又称触发器方式,在要抽取的表上建立需要的触发器,一般要建立插

入、修改、删除三个触发器,每当源表中的数据发生变化,就被相应的触

发器将变化的数据写入一个临时表,抽取线程从临时表中抽取数据,临时

表中抽取过的数据被标记或删除。在数据表没有任何增量标识的情况下,

通过对比上次数据缓存快照分析出数据的增、删、改操作。

3、日志文件抽取

在业务系统中添加系统日志表,当业务数据发生变化时,更新维护日

志表内容,当使用 ETL 加载时,通过读日志表数据决定加载那些数据及如

何加载。文件作为数据同步的一种适配器,主要能够满足对数据文件的读、

写、解析操作,文件抽取主要通过这个文件适配器来实现。

4、自定义 SQL 数据抽取

查询数据源除了直接针对表、视图之外,也可以直接使用用户自定义

第44页

石家庄市生态环境综合管理平台项目

39

的 SQL 语句,将 SQL 语句产生的结果集读取到 ETL 引擎中,供后续转化、

清洗、加载使用。

5、外部接口抽取

在任务管理中,新建任务时需要自动生成对应的 WebService/Rest 服

务,该功能主要通过通用 Web 服务接口将任务直接生成对外服务接口。

4.1.3.2.1.3 文件解析

通过文件解析功能,完成文件包解析(包括 XML 格式、TXT 格式、

Excel 格式等),抽取源文件数据结构及数据。文件解析的过程如下:

1、数据格式的分析

通过分析,其数据格式主要以关系型数据库为主,此外还包括如下文

件格式的数据:录入信息、加工过程信息、描述定义信息。其可能格式是:

关系型、XML 文件型、XLS 文件型、TXT 格式等和非格式化数据。

2、数据数量及质量分析

针对抽取源文件数据的数据数量和质量进行分析。

3、抽取源文件结构导入

主要是针对源文件,提供数据结构导入。数据结构主要为项目名称、

项目单位、项目状态、表名、字段名、字段中文注释、字段类型。

4、抽取源文件数据导入

把 XML 格式、TXT 格式、Excel 等格式的源文件数据导入数据库中。

4.1.3.2.2 数据清洗

数据加工清洗管理,用来统一管理并调度对数据源的各类数据加工原

子操作,以提升加工执行效率和自动化程度。

第45页

石家庄市生态环境综合管理平台项目

40

4.1.3.2.2.1 清洗转换规则管理

数据清洗指的是针对系统的各个环节可能出现的数据二义性、重复、

不完整、违反业务规则等问题而提供的脏数据处理功能。系统允许通过条

件抽取、过滤、筛选等手段将有问题的数据剔除或转换掉。具体过程可根

据实际情况调整相应的清洗策略。为了满足特殊转换清洗需求,系统还支

持以接口扩展方式创建自定义转换节点,能够以修改 XML 文件配置的方

式增减映射工具中的转换节点,方便用户实现自定义数据清洗功能,以最

终保证数据的可用性、完整性、一致性和安全性。

数据转换是根据元数据模型,将抽取出来的数据通过一系列的函数、

方法转换成目标数据源所需要的格式。数据交换服务的映射工具中以节点

形式提供了诸如字符串拆分、合并、替换、大小写转换、截取、统计等常

用的转换节点。可以根据需要添加自定义转换节点。

数据转换是将源数据结构转换为目标数据的关键环节,其中包括数据

格式转换、数据类型转换、数据汇总计算、数据拼接等功能节点。这些转

换可以在不同的应用场景下随需编排定制。转换过程可以定义为数据库内

转换,也可以在数据流程中转换。

4.1.3.2.2.2 任务计划及调度管理

根据数据清洗转换规则,生成任务,实现对实时任务和非实时任务的

分类、策略解析、生成、启动、调度并执行。定义数据提取任务属性,包

括提取数据表、数据范围、数据类型(文件、数据库)、提取任务的触发

时间;定义任务提取调度程序,按定义的属性创建多个任务进程,提取定

义的数据集合。支持调度方式、手动方式、WebService 方式等启动 ETL 任

务。

第46页

石家庄市生态环境综合管理平台项目

41

4.1.3.2.2.3 数据清洗转换执行

根据已生成的清洗转换任务,核验数据中存在的问题,包括格式错误、

编码错误、代码错误、关联关系错误,并记录检查中发现的错误类型、错

误等级、明细数据对应关系等。任务执行支持定时与实时两种方式,定时

触发即由系统时钟在指定时间点启动执行,实时触发即由数据清洗指标提

取模块直接调用规则执行操作,完成数据清洗处理及转换、整合工作。

4.1.3.2.2.4 清洗比对

清洗比对包括以下内容:

1、元数据加载

定义数据提取任务属性,包括提取数据表、数据范围、数据类型(文

件、数据库)、提取任务的触发时间;定义任务提取调度程序,按定义的

属性创建多个任务进程,提取定义的数据集合。

2、数据清洗规则设定

通过规则清单列表,选择数据清洗转换作业适用的数据规则。

(1)空缺值的清洗

对于空缺值的清洗可以采取忽略元组,人工填写空缺值,使用一个全

局变量填充空缺值,使用属性的平均值、中间值、最大值、最小值或更为

复杂的概率统计函数值来填充空缺值。

(2)不一致数据的清洗

不同部门所记录的代码数据可能存在不一致。有些数据不一致,可以

使用其他材料人工加以更正。此外,数据集成也可能产生数据不一致。

(3)重复数据的清洗

目前消除重复记录的基本思想是“排序和合并”,先将数据库中的记

第47页

石家庄市生态环境综合管理平台项目

42

录排序,然后通过比较邻近记录是否相似来检测记录是否重复。消除重复

记录的算法主要有:优先队列算法,近邻排序算法(Sorted—Neighborhood

Method),多趟近邻排序(Multi—Pass Sorted—Neighborhood)。

3、数据清洗转换执行

根据已定义的数据清洗规则和提取指标,核验数据中存在的问题,包

括格式错误、编码错误、代码错误、关联关系错误,并记录检查中发现的

错误类型、错误等级、明细数据对应关系等。规则执行支持定时与实时两

种方式,定时触发即由系统时钟在指定时间点启动执行,实时触发即由数

据清洗指标提取模块直接调用规则执行操作,完成数据清洗处理及转换、

整合工作。

4、数据清洗结果处理

数据清理是将数据库精简以除去重复记录,并使剩余部分转换成标准

可接收格式的过程。数据清理标准模型是将数据输入到数据清理处理器,

通过一系列步骤“清理”数据,然后以期望的格式输出清理过的数据。数

据清理从数据的准确性、完整性、一致性、惟一性、适时性、有效性几个

方面来处理数据的丢失值、越界值、不一致代码、重复数据等问题。

4.1.3.2.2.5 数据加载

根据不同情况,采取增量加载、全量加载等不同策略,将抽取转换后

的数据,加载到数据库中。可配置插入、更新、删除、插入更新、删除插

入等多种加载策略,实现数据加载。支持多种数据加载方式,可以做到直

接插入新数据、可以判断数据是否存在如存在则更新否则插入、可以判断

数据是否存在如存在则删除再插入及支持增量加载。

第48页

石家庄市生态环境综合管理平台项目

43

4.1.3.2.2.6 数据清洗转换结果分析

根据已定义的数据清洗规则和执行检查结果,合成数据质量检查结果

提示信息,在提示信息中支持由错误信息关联明细数据显示,并发布和展

现。提供按报送单位、错误类型、错误等级在不同时间区范围内的统计功

能。

4.1.3.2.3 数据处理

从业务角度对数据进行清洗、加工、比对、校核等处理,实现数据间

的关联、映射、去重、整合、分析等处理,为业务提供数据支撑。过程中

需要处理各类数据,包括基础数据和业务数据,业务数据又包含标准数据

和非标准数据。

4.1.3.2.3.1 标签管理

标签管理主要用于追溯数据来源,通过对数据打标签方式,记录原始

数据在整个数据生命周期内(数据产生、传播到消亡)的数据日志或数据

档案,用于追踪数据的起源和重现数据的历史状态。

对每条记录为单位进行打标签处理,标签将跟随该数据记录在后续数

据清洗、加工、转换、整合等一系列过程,从而体现每条记录数据流转过

程,用以实现数据的溯源及历史状态。

本项目标签管理的原则如下:

1、标签特性:唯一性、稳定性。

2、标签定义:数据类型+批次+表名代码+数据来源+文件形式+时间戳

+序列号。

3、数据类型:来自 6 项标准,包括基本信息、司法信息等。

4、表名代码:为每一个表生成一个代码。

第49页

石家庄市生态环境综合管理平台项目

44

5、批次:来自交换平台,可以逻辑标识前置端的每一批数据。

6、数据来源:来自交换平台/上传文件/手工报送。

7、文件形式: 原始数据上报时的文件形式。

8、时间戳:数据进入加工库的时间。

9、序列号:随机生成一串字符,避免数据重复。

4.1.3.2.3.2 记名管理

记名管理主要实现采集或抽取的多源异构信息,记于主数据名下,与

主数据进行比对,从而实现数据关联、匹配,为后续数据的分析、利用做

准备。

4.1.3.2.3.3 数据校核

1、自动校核

数据校核主要目标是用户对提供的共享数据进行校核,对校核发现的

数据问题进行处理,并反馈给数据来源方。为进一步提高数据质量,从数

据产生到各业务环节的流转上,保障数据的真实性、准确性和完整性而进

一步对数据进行验证的过程。校核包括基准校核和多源校核。

2、人工审核管理

经过自动处理的数据,在数据抽取、清洗转换、加载入库前,必须经

过人工二次审核,以便保证数据质量。当数据处理完毕后,审核人员需要

根据业务规则和标准规范,对数据的业务关联性、业务合规性、数据时效

性等关键内容进行人工审核,对审核无误的数据,同意加载入库;对审核

存在问题的数据,不同意加载入库,同时该数据将进入异常库进行处理。

3、异常数据处理

按照数据质量检查规则,通过人工比对和智能自动比对,对不符合质

第50页

石家庄市生态环境综合管理平台项目

45

量标准的异常数据通过建立异常数据库集中性存储,通过管理页面将异常

数据直观展现,并提供智能检索功能, 管理人员可以及时掌握数据中心当

前数据质量情况、异常数据分布、异常数据错误类型等情况、异常数据责

任部门修复完善情况等。同时异常数据将及时推送给相关责任处室、部门

及单位进行完善修复,审核人员对数据修复情况进行核实确认,审核通过

的数据恢复为待采集状态,重新归集到数据中心。

4.1.3.2.3.4 数据整合

数据整合采用必要的数据获取方式,对污染源、环境质量测点等相关

联的不同来源的异构数据进行高效整合,保证数据的唯一性及原始数据的

关联性。

4.1.3.2.3.4.1 数据整合思路

根据对数据整合工作理解,在数据整合的过程中考虑安全、质量、合

规性和归档等方面的因素,主要思路如下:

1、在数据整理阶段,依据数据库体系设计结果,对被整理的历史数据

进行细致的整理,主要包括数据内容分析,数据结构分析,质量分析,源

与目标差异分析等,详细的整理结果是后续工作的重要依据;

2、根据数据整理成果制定相应的初始化过程、方法和转换策略,选择

合适的初始化工具;

3、使用数据整合设计工具进行数据初始化,包括数据采集、转换和加

载等过程,并对初始化过程进行调度和错误处理;

4、数据安全包括源数据安全、初始化过程数据安全和初始化结果安全

三部分,分别制定相应的安全策略;

5、数据质量包括源数据质量评测、初始化过程质量检查和初始化结果

百万用户使用云展网进行电子书籍的制作,只要您有文档,即可一键上传,自动生成链接和二维码(独立电子书),支持分享到微信和网站!
收藏
转发
下载
免费制作
其他案例
更多案例
免费制作
x
{{item.desc}}
下载
{{item.title}}
{{toast}}