数据矿山,如何开采?
来源:福建日报 时间:2019-05-16 07:24

 

福州滨海新城的数字福建云计算中心(商务云)大楼,数千机柜内的设备昼夜不停运转,每秒都有海量数据在“狂奔”。

  经过19年积累,“数字福建”建设汇聚了上规模的数据资源。

  在数字福建云计算中心,公安、工商、民政等省直部门和各设区市1700多类27.7亿多条数据已经“上云”。它们来自全省1000多个应用系统,形成了稳定的数据供给。

  这些数据,目前大多被用于改善政务服务,提高政府部门的决策水平,惠及民生。

  然而,更进一步地开放开发这座“数据矿山”,让数据变成数据资产,推动产业发展,带来真金白银,却并不是件简单的事。首要的难题,便是提升数据治理能力,让数据标准更统一、质量能提高、安全有保障。

  由谁完成?如何完成?目标在哪?本期《助创》带来记者的观察。

  难啃的骨头,海量数据面临治理难关

  最近一段时间,余劲松弟正带领团队进行一项他认为很有“战略意义”的研发——编制政务数据的ISO标准、国家标准和地方标准。

  作为福建省空间信息工程研究中心的副研究员,余劲松弟所在的研究中心,是数字福建大数据技术服务中心,负责我省政务信息共享平台建设与运行,也负责组织省级部门开展电子政务顶层设计。《福建省政务信息共享管理办法》《福建省政务数据管理办法》等政策法规,由这里承担和参与编制。

  记者了解到,该中心已实现了全省3800多万人口、123万企业法人、4300多万张电子证照等核心业务数据的大汇聚,并整合了我省140个部门近千个非涉密应用项目,在全国率先实现所有省直部门政务数据统建共享、汇聚开发。

  然而,尽管这个政务数据的“集散地”汇聚了海量数据,但数据治理却成了“难啃的骨头”。

  “汇聚过来的政务数据质量参差不齐,有些数据因多头采集有所重复,且各个数据平台建设标准不统一,也影响了数据的治理与开发。”余劲松弟说。

  我省2016年出台的《福建省政务数据管理办法》规定,政务数据汇聚共享平台,由省、设区市数据管理机构按照统一标准,在省和设区市两级建设部署、分布运行,数据生产应用单位应当将本部门业务信息系统接入本地区政务数据汇聚共享平台,并按照采集目录、登记信息以及标准规范,在规定期限内向政务数据汇聚共享平台汇聚数据。

  统一标准、统一平台、集中汇聚,目的是在进行数据应用、治理与开发时能更有效率。福建省空间信息工程研究中心副主任吴升告诉记者,按照管理办法,各地各部门新上的政务信息系统,其标准都与政务数据汇聚共享平台统一,但较早建设的信息化系统,则要对数据进行治理后才能接入,工作量非常大。

  余劲松弟告诉记者,他正在进行的数据标准编制,是以实现数据汇聚全自动化为目标的,标准化了的数据将由平台自动汇聚、清洗并保存,尽可能减少人为干扰,方便进行数据治理。但目前,这样的设想还未实现。

  必要的工作,数据经治理才能发挥价值

  繁多的数据目录,海量的动态数据,让建立数据标准,优化数据治理显得困难重重。

  “国家信息中心平台里涉及的数据目录有几十万条,每一条目录里都有标准名称,所以做数据标准是一个比《康熙大字典》还宏大的工程。”浪潮集团执行总裁王柏华告诉记者,“这些年几乎每个部门都在进行信息化,但不同时期的信息系统有不同的版本,它们产生的数据名称不统一、字段不一样,如果没有治理,采集的数据难以发挥价值。”

  记者了解到,探索数据的应用场景与商业模式,正成为业界努力的方向。由于约80%的政务数据都掌握在政府手里,治理这些国有资源,须由政府部门来主导,结合产业进行应用开发。

  《福建省政务数据管理办法》提出,省、设区市数据管理机构可以授权有关企业以数据资产形式吸收社会资本合作进行数据开发利用;授权企业应当通过公开招标等竞争性方式确定合作开发对象。这样的政策,意味着数据治理可以以政企协同的方式进行。

  如何协同?吴升告诉记者,借助已经治理完善的政务数据,福建省空间信息工程研究中心正联合业界酝酿开发“证件宝”等市场化政务应用,发挥政务数据的商业价值。据介绍,该中心已在政务领域开展一照一码、电子证照、精准救助、应急管理的方面的行业应用,并与福大经纬、星云大数据应用服务公司、慧政通等企业协同推进成果转化。

  尽管在部分领域已有成效,但出于招商引资的考虑,政府部门对数据进行全面基础治理仍是必要的。在我省,由政府部门主导的数据资源治理、开发、应用已经迈出步伐。福建省大数据管理局局长陈荣辉指出,我省已组建30人规模的公益性政务数据一级开发团队,负责政务数据汇聚清洗、分类整理、脱敏脱密、质量管理和授权开放等工作,以促进政务数据资源有序开放和开发利用。

  可能的方向,从局部入手进行应用开发

  2019年福建省政府工作报告指出,加快数据资源整合共享,在制造、金融、医疗、健康、安防、政务等领域,实施100个人工智能应用示范项目,形成100个深度应用场景,推动人工智能与经济社会发展深度融合,推动数字产业化、产业数字化。这为数据治理的方向提供了指引。

  以医疗为例,王柏华告诉记者,结合数据开发的下游需求,可先对局部数据进行治理,服务产业应用。“现在很多医疗数据都已经实现了汇聚,包括医生的医嘱数据、医疗病案数据等,如果全部进行治理要花费大量的时间和费用。在山东济南,我们的办法是先把有用的数据找到,如药方等,然后在这个基础上对接下游,支持产业创新。”王柏华说。

  记者了解到,我省是全国公共信息资源开放试点省份,浪潮集团参与搭建的全省公共信息资源统一开放平台于今年1月开通。平台作为全省统一开放窗口,第一批已开放了700多个数据集、1300多个服务接口,6亿多条结构化数据,涵盖21个民生领域,促进政府数据社会化增值再利用。

  福建省大数据管理局局长陈荣辉指出,福建正借助结构化、标准化、可机读数据优势,计划开放超过50个重点领域经过脱敏的标注数据,引进一批大数据开发企业落户。

  “现在数据应用呈现百花齐放、百家争鸣的局面,每个地方都有局部的创新,但还未进入全面创新时代,平台建好了,数据真正用起来,我认为还有很大的距离。”王柏华告诉记者,数据资源与数据环境,正成为城市竞争力新指标,政府部门应花力气与经费进行跨部门协调,优化数据治理,改善营商环境。(记者 游笑春/文 游庆辉/图

附件下载

扫一扫在手机上查看当前页面

相关链接