第一章 大数据与经济新闻概况
第一节 相关概念解析
一、大数据概念
随着信息网络技术的发展及新兴科技的出现,数据呈现了爆发式增长。图 1 显示了现代社会数据生产状况。当今世界人口 70 多亿,而手机拥有量也近 70 亿,互联网使用者约 30 亿,社交媒体应用者约 20 亿。可见数据的大规模增长主要来源于互联网、社会化媒体、移动终端等平台。
正是数据的爆炸式增长带来“大数据”这一概念。2011 年麦肯锡发布的研究报告中,用“大数据”形容和描述了数据爆炸增长带来的海量数据。除了海量数据之外,相关研究还认为以海量数据挖掘、分析与应用为主的数据处理能力也被包含于大数据概念中。综合各方研究,本文认为大数据包含了三个层面的含义:第一,大数据是一种数据集合,这种数据集合超过了一般计算机的数据处理能力,无法在一定时间用通常的数据处理程序抓取、挖掘,存储与分析。这种数据集合首先是数据量级的巨大,除此还有数据类型多样(Variety),数据处理速度快(Velocity),数据价值密度低(Value)的特点6。这种数据集合除了包含大量常规的结构化和半结构化数据,还包括了海量非结构化数据和交互数据。其中结构化数据也可称为二手数据,即已经被处理过的数据包括政府和企业发布的各类统计数据以及第三方数据库中的数据等。非结构化数据,主要是各种网络数据以及用户行为数据,包括了移动终端、传感器、可穿戴设备产生的数据,社会化媒体中的UGC和用户行为数据。这类数据需要新闻生产者主动抓取过滤后才能应用于新闻生产,这类数据量级大类型杂,是“大数据”的丰富来源,得益于大数据技术的发展才能被处理利用。第二,大数据代表了一种技术趋势,是一种进行大数据抓取、存储、解析的数据处理能力。大数据技术是以云计算为基础的信息存储、分享和挖掘手段,可以便宜有效的将那些大量、高速、多变化的终端数据存储下来,并随时进行分析与计算。大数据技术涉及种类多样,其中数据技术方面,数据获取与整理技术、数据语言与开源框架建设、数据可视化技术如 Django 开源模型、统计和可视化 R 语言、适用于文本挖掘的 Python 语言、最简便的数据整理工具 Ecxel 等被应用较多。第三,大数据代表了一种新型的思维方式,即一种大数据思维,主要具有以下三大特点:一是对于数据的处理,不再依赖于随机抽样,有时候甚至样本等于全部;二是信息分析不再执着于追求精确性,而是混杂性,不拘泥于小数据的精确,通过对大量数据的分析,发现趋势,进行宏观层面的洞察;三是不再热衷于寻找因果关系,而是注重事物相关性的分析。
...................
第二节 经济新闻与大数据
数据是经济新闻的必不可少的生产要素,经济水平的衡量,经济活动的变化,经济趋势的判断、消费市场的观察都离不开数据的呈现和展示。经济活动的变化往往通过经济数据进行记录和反映,因此经济数据是构成经济事实的重要组成部分。与其它新闻类型尽量减少或避免数据的使用不同,经济新闻报道中数据的运用成为常态,大量的量化和计算是它的显著特征12。经济新闻是通过对各种经济数据的分析,进行专业化的报道的,甚至有的经济数据本身就是新闻,比如涉及宏观经济的国内生产总值(GDP)、基尼系数、消费者物价指数(CPI)等,这些数据的变化直接反映了经济情况的变化,因此这些数据本身就成为了经济报道的内容。而经济新闻中的财经新闻因为聚焦于金融资本市场,更是常常与数据打交道,各种金融数据、交易数据、股票价格变动中都是其报道的内容。公司财务数据、行业指数等常常是产经新闻关注的重点,物价、各种消费数据是市场经济新闻报道的内容。可见经济新闻与数据有着天然的紧密型,并且经济数据的产生具有长效机制,可以不断产生和更新。
因为经济新闻与数据的天然紧密型,所以即便在大数据之前经济新闻也会注重数据的利用。在大数据前,数据在经济新闻中的作用主要是:一是从量化的角度来阐释经济现象,揭示报道主题,增加经济新闻的公信力和可信度;二是通过比较经济数据的变动,说明对经济现象的认识即用经济数据佐证观点。传统经济报道虽然注重了数据的利用,但总体而言,数据是增加增强报道真实性与形象感的辅助材料,隐藏于数据背后的价值并未被充分挖掘。尽管有些经济新闻也会对上市投资公司、金融资本市场及各种产业数据进行收集和挖掘,在此基础上进行选题开发。但所涉及数据分析量较少,数据处理水平有限,数据还是不能被充分利用。因此有许多研究都指出,经济新闻中数据的应用存在诸多问题:一是简单堆砌、罗列,二是对数据的解读浅尝辄止,三是数据运用缺乏科学的态度。可见,在大数据之前,尽管经济新闻报道领域涉及了大量的经济数据,但因为思维和技术限制,数据价值未被充分利用。
...................
第二章 大数据时代经济新闻的实践
第一节 经济类数据新闻实践分析
数据新闻是在大数据影响下产生的一种新型报道形式。数据新闻又称数据驱动新闻,《数据新闻学手册》认为:“数据新闻将传统的新闻敏感性和有说服力的叙事能力,与海量的数字信息相结合,创造了新的可能。”简单说,数据新闻就是以数据为核心,阐述事件背后的关联性,揭示事实背后的意义,包括了数据的收集、整理、过滤、分析、呈现等过程。近年来《卫报》、《纽约时报》、《华尔街日报》、BBC 等国际主流媒体不断进行数据新闻实践,推出了一些经典作品。国内的一些门户网站以及传统新闻媒体也纷纷试水数据新闻。因为经济新闻和数据的天然紧密性,大数据对经济新闻的影响尤其明显。而经济类数据新闻则是大数据影响下产生的生的一种新型的经济新闻报道形式。《金融时报》、《经济学人》、彭博社等专业的财经媒体都在经济、财经领域开展了数据新闻业务,并正在从简单描摹事件表象转向数据内核意义的挖掘。国内门户网站的财经频道如搜狐财经、腾讯财经以及专业的财经媒体财新网和《21 世纪经济报道》也都开设了相关的经济类数据新闻栏目。
本文将以搜狐财经的《图解财经》,财新网的《数字说》以及国外的彭博网的“Bloombeg Visual Data”为研究对象,对经济类数据新闻进行一些量化研究,探索经济新闻在大数据影响下的变化。
本文将经济类数据新闻根据其报道领域分为:(1)政经新闻。主要涉及国内外政府机构相关的财经政策制度以及宏观经济的报道分析。(2)财经新闻。包括证券市场和各类金融投资市场的新闻。(3)产经新闻。包括了各个行业、企业的报道,如 IT 产业、汽车产业、房地产以及具体公司的相关报道等。(4)市场新闻。是指与大众生活关系密切的经济信息如物价变化、收入、消费情况等信息。
从数据来源方面分为:(1)政府(2)非政府组织(3)第三方机构(4)企业(5)其它媒体(6)媒体自身(7)网络数据(8)高校、学术机构
.......................
第二节 机器人新闻实践
“机器人新闻”指的是通过计算机抓取数据自动撰写新闻。机器人新闻可以说是大数据技术作用下的产物。美国的Narrative公司可谓是进行机器人新闻实践的典型代表,通过使用 Narrative Science 算法,生成一篇新闻报道只需花费大概 30 秒的时间。Narrative 的生产新闻的的基本套路为:首先通过计算机软件抓取糅合大量数据,之后按照编程人员设定的算法从不同角度“识别”数据,选择由资深记者团队设定的模板,将各个词汇汇成句子,生成文章。美联社使用的机器人 wordsmith,可以自动生产财报报道的内容。任何数据格式如 APIs、XML、CSVs、spreadsheets 等都能被识别,通过设定的算法发现数据的关联和特点,依据设定的模板可以生成叙述性的报道、图表15。目前,该平台有超过 3 亿模版可供不同的新闻源使用。现在的机器人新闻基本是“人工创建的模板”与“自动化数据填充”结合的生产模式。
在中国,腾讯财经于 2015 年已经开始了机器人新闻实践。2015 年 9 月 10 日,腾讯财经发表了的《8 月 CPI 涨 2% 创 12 个月新高》的新闻即是由机器人 Dreamwrite 撰写的。机器人根据演算法,将自动抓取的情报按照预先设定的结构自动生成稿件,1 分钟内就能将资讯呈现在用户面前。据腾讯财经介绍,这只是自动化写作迈出的第一步,未来将继续探索能够依据受众的个性化需求进行大数据服务新闻的智能化写作。
目前,机器人新闻的生产实践还主要发生于金融和体育领域。可以说财经新闻是最适于机器生产新闻这一模式的,一方面证券、金融市场都涉及大量波动性很强的数据,每天每时都会源源不断的产生新数据,拥有大量的数据素材,另一方面,金融题材的新闻写作追求客观性和理性化,已经形成了相对固定的模式,因此在创建写作模板上会相对容易。尤其在一些财经资讯方面,通过机器实时抓取财经数据如股票、债券行情和汇率、原料价格等,快速生成新闻,既可以提高财经新闻的时效性,也可以解放记者生产力,专注对数据的解读和分析,专注于深度报道的生产。
.....................
第三章 大数据对经济新闻的影响................................24
第一节 大数据对经济新闻报道理念的影响............................24
一、强化的数据思维 ........................24
二、注重相关性..........................25
第四章 大数据时代经济新闻的未来发展........................38
第一节 大数据时代经济新闻发展趋势................38
第二节 大数据时代经济新闻发展策略.......................39
第四章 大数据时代经济新闻的未来发展
第一节 大数据时代经济新闻发展趋势
数据驱动的深度报道将是大数据时代经济新闻发展的重点和价值所在。通过前面对于现有的经济类数据新闻实践分析,发现目前经济类数据新闻呈现了两种发展特点,即基础数据说或称图解新闻和数据驱动的深度报道。图解新闻紧抓新闻热点和话题,时效性强,生产周期短,呈现方式形象化,可以为受众带来轻量化的阅读体验,似乎极其适用于经济通讯类作品,有文章观点认为“数据新闻之于通讯类作品,”短、平、快“的图解是发展趋势”。本文认为图解新闻其实是目前数据新闻在中国的过渡阶段。“数据新闻”对互联网技术有着高度的依赖性,在数据收集、分析、可视化阶段都由计算机技术支配,所以提高计算机技术掌控力对于数据新闻生产极其关键。而中国在大数据之前,没有经历过以海量计算为特征以精确新闻学为代表的计算机辅助报道的发酵、成熟,中国媒体在进入数据新闻领域时有其文化资本上的障碍24,所以大数据时代数据新闻的生产只能在模仿与探索中发展,即便经济新闻相比其它类型的新闻拥有数据利用和分析的能力,但是大数据时代对于大量非结构化数据的挖掘与利用仍超过了其掌控的数据处理能力,这使得经济类数据新闻只能从对结构化数据的整理分析中起步,从应用数据可视化技术开始探索。这也就导致国内经济类数据新闻的发展是基础的数据说占比较大。而随着对于数据挖掘技术发展与应用,国内以财新“数据新闻与可视化”为代表已经开始了对于数据的深度探索,数据驱动的深度报道不断涌现。而未来随着大数据技术的发展与成熟,对于经济数据的深度探索将成为常态化,数据驱动的深度报道将是经济新闻发展的重点。经济新闻的价值在于对于人们经济活动的参与提供指导,所以时效性和专业性是其价值所在,尤其财经新闻直接关系到专业的投资理财,对时效性和专业性要求更甚。在时效性方面,机器人新闻将大展宏图,利用大数据技术检测周期性发布数据的网站,实时监测经济数据的变动,抓取数据,自动完成数据的分析处理、写作,抢占时效性。而大数据时代随着大众经济素养的提升,对于经济新闻的需求将不仅仅是简单的新闻资讯,或者是注重阅读体验的图解新闻,对于受众尤其专业投资者来说经济新闻的专业性和深度性更为重要,这就需要通过财经媒体人将更多的经历放在生产有价值的内容上,充分利用数据处理技术挖掘大量经济数据中隐藏的价值,进行专业化的解读,提高经济新闻的专业性。
....................
结语
我们已经进入了大数据时代,大数据变革了社会生活的各个方面,新闻传播业也在其列。作为与数据紧密关联,把数据作为重要生产要素的经济新闻,大数据对其意义和影响更为深刻。而目前关于大数据与经济新闻的相关研究还比较少,没有系统的论述,所以为了弥补这一研究空白点,本文选择经济新闻作为研究对象,去探究大数据对其的影响。
在大数据影响下,经济新闻产生了“经济类数据新闻”和“机器人新闻”两种新型报道形式。“机器人新闻”是大数据影响下变革生产方式产生的新型报道形式。经济类数据新闻是媒体思维与大数据技术的结合,相较“机器人新闻”是大数据时代经济新闻更高级的实践形式。大数据思维冲击了经济新闻报道理念,使得经济新闻报道更加注重数据思维,注重相关性分析,加强预测性。大数据解构了经济新闻传统的生产流程,人机协作将是未来经济新闻的生产方式,可视化的呈现方式平衡了经济新闻的专业性和通俗性。大数据提升了用户的反馈机制,为个性化传播提供了可能。在大数据影响下,定制新闻的发展将改变经济新闻的盈利方式。大数据时代数据驱动的深度报道是经济新闻未来发展策略。而为了提高经济新闻的专业性和时效性,财经媒体应该积极拓展数据获取渠道,通过数据库的建立时刻进行数据的监测,通过数据挖掘长效机制的建立,提高数据挖掘意识,建立科学的数据分析方法,保证数据的正确使用。同时财经媒体人应该提高数据素养,具备辨别、分析数据能力,理应对待大数据,认识到大数据是一种工具与方法,不能凌驾于人之上,重要的是财经媒体人员对数据背后意义的专业解读。
参考文献(略)