一、 相关概念及理论基础
(一) 政府数据开放的概述及与相近概念的辨析
1. 政府数据开放的定义
政府数据开放在国外常称作开放政府数据(Open Government Data,英文简称 OGD),它是开放政府、开放数据和政府数据三方面的共同集合,在政治层面,它是开放政府的内在要求;在技术层面,它需要开放数据;在行政层面,它的重点是政府数据。其中,政府数据不仅包括政府日常工作运行所产生的数据,还涵盖其他公共部门和组织所保存的数据资源。开放政府数据既是开放数据在政府领域的应用,同时也是政府为实现开放而向社会发布数据的行为41。
世界银行认为,如果数据能够被任何人免费自由地访问、获取、利用以及分享,便可称其为开放数据(open data)。2013 年 6 月由美、英等八国集团领导人在 G8 峰会上共同签署的《开放数据宪章》中,开放数据被描述为具备必要的法律和技术特性,在任何时间、任何地点、能够被任何人自由进行利用、再利用和分发的电子数据。世界银行和《开放数据宪章》的定义都强调了开放数据需要被社会进行的充分利用和再利用,从而充分释放数据中所蕴含的能量,进而最大限度的为社会创造经济价值。开放政府工作组(OGWG)认为,以专门的数据开放平台和数据目录为依托,将政府所掌握的以结构化形式存储的、符合开放授权要求的政府数据免费向公民和其他组织开放并供其自由访问和使用即是开放政府数据42。经合组织(OECD)认为,政府数据开放能够在提高政府的参与度、透明度和责任以及改善公民生活质量等多个方面创造社会价值。英国政府数据开放平台认为,开放数据是以开放格式发布的数据,它是机器可读的,并且是在允许免费重用的许可下发布的43。麦肯锡研究所认为,政府开放数据必须具有可访问性、机器可读性、成本免费或可忽略不计以及权利限制最小等四个特征。本文在这里采用我国付熙雯以及数据开放领域的著名学者郑磊的观点。在他们看来,利用发达的信息技术免费向公众主动开放能够被机器读取的、多种格式、一手的、没有专属所有权限制的公共数据资源,以满足大众需求即是开放政府数据44。无论是个人、企业还是机构以及各类组织,他们都可以对这些数据进行科研和开发。
表 1:开放数据应当具备的八个条件
(二) 理论基础与研究框架
1. 开放政府理论
“开放政府”的概念最早出现在《开放政府原则:依据宪法的知情权》一文中,它是由 Park 在上世纪 50 年代提出。在他看来,政府应积极倡导开放数据和公开信息,使其成为一种社会常态,其目的是为了维护公民的知情权。我国的学者王本刚和马海群进一步指出,信息公开和数据开放则是开放政府的前提和条件,公众参与和社会合作是开放政府理论的本质内容47。该理论提倡政府应该免费向社会公众公开其所掌控的公共数据(国家机密、个人隐私等数据除外),在这一过程中政府还要积极鼓励社会合作和公众参与。社会公众的数据信息素养在这一过程中得到了提升,可以为政策的制定积极献言献策,进而推进社会公共服务不断发展。该理论关注了公民的知情权,注重公众的参与和合作,受到了学界和各国政府的关注和重视。
当前,我国各级政府在都在积极倡导共享和开放数据,并通过增强政府数据的公开性和拓展开放数据所涉及的领域及范围等方式来提升政府的透明度。同时,政府各部门也需要社会的关注和参与互动,通过增强社会公众的合作参与度,可以激发公众和企业参与平台建设的热情。因此,开放政府理论为政府数据开放平台建设奠定了坚实的理论基础。
2. 研究框架
此次针对北京市政府新冠肺炎数据开放的研究,笔者选取的是由复旦大学数字与移动治理实验室(DMG)构建的“中国开放数林评价框架”。基于多年的研究积累和大量的数据监测分析,该评价框架主要用来以衡量和分析一个地区数据开放程度和水平。它既结合了开放数据的原则与标准,又借鉴了众多国内外数据开放方面的研究成果和评估报告,是立足我国政府数据开放的实际情况并符合当前发展阶段的一套科学的、系统的、多维度的、可操作的评估框架。基于该模型框架推出的《中国地方政府数据开放报告》每半年发布一次,对各级地方政府所经营“数木”的繁茂程度及果实价值进行测量。自 2017 年 5 月首次发布以来,该系列报告在一定程度上对我国政府数据开放生态体系的建设与发展起到了推动作用。目前该系列报告已经被国家网信办采用,并成为监测我国公共信息资源开放情况有力的数据支撑。
.................................
二、 北京市政府新冠肺炎数据开放现状及分析
(一) 北京市政府数据开放平台的现状
2012 年 10 月,作为国内首批推出地方政府数据开放平台的试点地区,北京市政务数据资源网(data.beijing.gov.cn)正式上线。网站汇集和整合了北京市相关政务部门提供的能够向社会进行开放的政务数据资源,并向用户提供了下载和 API 接口调用服务。数据开发利用人员可通过 API 接口直接将网站上开放的数据资源应用的相关的数据产品中。目前该网站向用户提供的功能有 WPS、EXCEL和 CSV 等格式的原始数据下载服务、包含地理坐标信息的空间数据下载服务以及能够在线调用数据的 API 接口服务。此外,用户还可对使用网站所开放的数据开发相关 APP,并在线进行提交和备案。
图 2:北京市政府数据开放平台首页
................................
(二) 北京市政府新冠肺炎数据开放的现状
目前,北京市有关新冠肺炎的数据信息主要集中在北京市卫生健康委员会官方网站(wjw.beijing.gov.cn)和北京市政府数据开放平台(data.beijing.gov.cn)。其中,北京市卫生健康委员会官方网站专门开设了“北京市新冠肺炎防控信息专栏”,专栏内设“政策文件”、“疫情通报”、“防控知识”、“媒体聚焦”和“防控工作”等五大版块,在与新冠肺炎关系最密切的“疫情通报”版块中,集中收录了自 2020 年 2 月 4 日以来北京市所有的新冠肺炎数据和病历信息,然而,这些内容都是以文本形式在“通知通报”中呈现,相关的疑似和确诊数据、病历行程轨迹和个案信息等都是以零散的、碎片化的方式分散在不同日期的“通知通报”中,并没有进行数据化的处理和清洗,也没有提供可被机器读取的、多种格式的数据资源,并不符合政府数据开放的标准和原则,因此,不属于本文的研究对象。
北京市政府数据开放平台在首页开设了“北京市新冠肺炎疫情防控和经济社会发展信息专栏”,专栏内包含了“新型冠状病毒感染的肺炎疫情信息”并提供了相关的确诊数据、空间数据和 API 接口。此外,通过在北京市政府数据开放平台首页搜索栏中对“新冠”、“新型冠状病毒”、“肺炎”和“疫情”等关键词进行检索,还出现了“北京市提供新冠病毒核酸检测服务的医疗卫生机构名单”,在专栏内开放了北京市提供新冠病毒核酸检测服务的医疗卫生机构名单数据信息,包括序号、机构名称、机构地址、对外服务联系电话、预约服务方式、网络预约服务链接、备注等字段,并提供了 API 接口服务。本文将结合“中国开放数林评价框架”对北京市政府数据开放平台上的新冠肺炎数据开放问题做具体的分析研究。
............................
三、 北京市政府新冠肺炎数据开放中存在的问题和不足.......................38
(一) 准备度层面存在的问题.............................................. 38
1. 数据开放的法律与政策不完备..............................38
2. 数据开放的标准和规范不完备.....................38
四、 推进北京市政府数据开放平台上新冠肺炎数据开放的对策和建议........... 43
(一) 夯实准备度根基保障........................................ 43
(二) 完善平台层功能模块...................................... 43
(三) 提高数据层质量水平..................................... 46
结语..................................50
四、 推进北京市政府数据开放平台上新冠肺炎数据开放的对策和建议
(一) 夯实准备度根基保障
借助“中国开放数林评价框架”,笔者发现北京市政府数据开放平台上新冠肺炎数据的开放现状和水平还有一定的改进和提升的空间。鉴于前文分析的结果,本研究从准备度、平台层、数据层和利用层四个维度提出了对策建议,希望能有助于北京市政府新冠肺炎数据开放的具体实践。
针对准备度的维度下有关数据开放的法律与政策不完备以及缺乏专门针对数据开放的标准和规范的问题,可以加强法律政策供给,进一步强化组织保障。
政府数据的开放共享必须由法律制度予以调整、 推进和保障60。重大疫情灾中政府数据的开放,更加需要完善相关政策法规体系。北京应尽快制定专门针对政府数据开放的地方性法规、地方政府规章或规范性文件,详细规定和阐明有关开放数据治理、开放方式、推动利用、安全保护和保障机制等方面的要求。目前国内在这方面做的较好的有贵阳市和上海市。
目前,贵阳市已经出台了四项专门性程度较高的法规和政策,其中《贵阳市政府数据共享开放条例》是目前我国首都针对数据共享和开放的地方性法规。上海市也已制定了《上海市公共数据开放分级分类指南(试行)》这一专门针对数据开放的技术规范,对数据开放的范围和分类分级等方面都作出了详细具体规定。
........................
结语
政府数据开放是一项长期的、系统的、复杂的工程,绝非一日之功,更不可能一蹴而就,需要结合自身实际情况在实践中不断的摸索和完善。本文以北京市政府数据开放平台为例,在当前新冠疫情肆虐全球的大背景下,结合“中国开放数林评价框架”对北京市政府数据开放平台所开放的新冠肺炎疫情相关数据进行了系统梳理和剖析,在选题和内容上兼具新颖性和时效性。通过研究笔者发现了当前北京市政府数据开放平台还存在配套政策和法律不健全、平台功能模块不完善、数据标准格式待提升、数据量少质低覆盖面不全以及缺乏有效利用成果等方面的问题。当然,新冠肺炎数据开放只是政府数据开放这一宏大工程中的一个小部分,笔者的目的是通过对具体实例的解剖分析来察微知著、举一反三,进而对北京市政府数据开放的具体实践提供有价值的参考建议。需要说明的是,政府数据开放除了文中涉及到的问题之外,还面临诸多的挑战,比如如何解决一个平台中各类数据质量参差不齐的现状?如何让全国各地新冠肺炎疫情数据开放工作都能够有法可依、有规可循、统一有序?如何处理数据开放过程中涉及的个人隐私暴露的风险隐患?如何在保护公民个人隐私与保障公众之情权之间权衡和取舍?如何处理人与技术之间的关系,让政府数据开放不但有速度,有进度,还有温度?另一方面,得益于大数据、物联网和人工智能等新兴技术的飞速发展,政府数据开放的应用前景也越来越宽广,从政府部门办公的数字化、智能化演进到数字政府的建设,从超大城市的治理到智慧城市的建设,这些都是政府数据开放研究领域将会涉及的研究课题。当然,我国对于政府数据开放平台建设的研究也是近几年才刚刚兴起,可供参考借鉴的文献资料和实践经验相对较少。由于笔者理论基础相较薄弱、专业知识掌握不够全面,学术能力有限,导致对此问题探究尚不够深入,虽然投入了大量时间对国内外以及北京市政府数据开放平台有关新冠肺炎疫情数据开放的内容资料进行了研究,但是,本文还存在许多不足之处有待改进,恳请专家批评指正。
参考文献(略)