论述送分系列|一篇文章告诉你大数据新闻对传媒行业的颠覆与重塑

整理编辑:觅游李楠学姐

写在前面:

2014年3月,在长达96页的《创新报告》中,面对赫芬顿邮报、BuzzFeed此类互联网媒体公司的激烈竞争,《纽约时报》忧心忡忡地发出了“我们真的落后了”这样的感慨。

很多初学者,对大数据的概念都是模糊不清的,大数据是什么,能做什么,学的时候,该按照什么线路去学习,学完往哪方面发展,想深入了解,想学习的同学欢迎加入大数据学习扣群:805127855,有大量干货(零基础以及进阶的经典实战)分享给大家,并且有清华大学毕业的资深大数据讲师给大家免费授课,给大家分享目前国内最完整的大数据高端实战实用学习流程体系
 

美国皮尤研究中心在2014年的媒体研究报告中,直言不讳地指出“我们正在寻找那些能够适应数字媒体采编流程的新闻采编多面手,比如数据库记者、可视化记者和计算机记者。”

在大数据时代,数字内容生产和数据挖掘分析成为常态,新闻领域也不例外,从用户服务模式到内容生产方式,再到媒体行业本身,无不在经历着颠覆与重塑。

大数据新闻之所以重要,是因为它有可能从根本上改变新闻的形态、生产方式和新闻从业人员所需的素质。从另一方面来看,过度信任数据所带来的危害已初露端倪。

无论是智媒还是算法这些新闻传播学的热点都与大数据新闻有着密切的联系,非常适合用各种题型对这一知识点进行考察,如果你还没掌握,我建议你好好读读今天的文章。

 一、大数据新闻有哪些应用形式?

1、新闻内容采集

(1)选题价值的精准判断

传统的新闻选题主要是头脑风暴和任务分派的结果,而将大数据引入选题决策环节则使其更为客观、更有效率,真正让用户参与到新闻生产流程中。过去受众反馈渠道有限,受众分析也是以传统的抽样调查为主,样本量有限,而且获得数据的成本高、周期长,难以快速全面地反映受众市场,这样的数据调查也很难成为日常性的工作来支持新闻生产决策。

而在大数据技术的支持下,参与调查或分析的用户量动辄以百万计,通过网络到达目标用户回收调查结果、或者直接从网络抓取热门搜索和舆情,较高的效率和较低的成本使编辑在日常工作中就可以做到迅速发掘热点并完成选题。

以腾讯《事实说》为例,制作团队基于腾讯新闻调查入口,同时自制多个H5社交产品,通过了解用户近期的关注点,来针对性地选择议题、策划内容。再如,纽约时报每天要推送300篇文章,此前编辑需要花大量的时间阅读来判断和筛选出可能符合用户需求的内容。而基于大数据和机器学习的工具Blossom则把人力从大量的工作中解放出来。大数据在发现选题、判断舆论趋势以及发现用户感兴趣的内容上,往往比有经验的编辑更为有效和精准。

(2)信息来源的多样化

传统媒体时代,新闻信息主要靠记者采访、调查获得,而大数据时代,新闻信息的采集者已经从专业记者向普通人转变,甚至从人向机器转变。

①众包:专业记者向普通人的转变

众包服务使得新闻来源从专业记者向普通人发生了转变,过去由记者调查收集分析信息的任务被转移到用户身上,而记者完成的是内容的再聚合,在这一过程中,新闻生产中的传播者和接收者的角色都被重构。

英国卫报的数据博客中有许多报道都是通过众包搜集信息的。比如在调查国会议员开销时,由于文件数量众多,多达45万个,但时间有限,于是卫报决定向读者开放项目,让读者帮忙翻看资料,寻找数据中的异常,来发现有报道价值的故事。

当记者面临大量的文件、统计数字或者报告需要核查时,采用众包的方式就成为了一个非常明智的选择,它可以高效地帮助调查记者完成任务、降低成本、节约时间。但目前这种资料搜集与信息核实的众包服务在新闻领域还没有被频繁地应用,同时众包的公众平台与媒体之间还难以真正理解彼此的需要和责任边界,因而合作并不像想象的来得那么容易。

②传感器与无人机:人向机器的转变

传感器和无人机应用于新闻生产领域,意味着信息采集者开始由人向工具转变。传感器在新闻生产中的作用主要在于生产或收集数据。它为数据新闻打开了新局面,提供了大量的数据来源。记者可以利用实时数据制作实时更新的动态图表,或者基于数据做预测性分析。

此外,传感器还开辟了许多过去由于数据不易获得而难以报道的领域。当然它也有一些弊端,比如数据的质量可能会受到很多方面的影响,设备质量不过关、缺乏统一标准或者被人为篡改等。

无人机可以看作传感器的一种,是对人们视觉感官的延伸。无人机携带摄像机从高空传回影像数据,记者将这些数据应用到新闻报道中。其他的传感器更多的是数据上的直接回传,而无人机则提供更为直观的影像。在视听信息生产领域,众包、直播、VR等前沿应用可以相互结合,比如,无人机与众包的结合。以Twitter为例,其用户可以利用推文,对无人机的飞行方向、区域等进行遥控,同时快速获取所拍摄内容,并上传到社交网络上,并且还可以用无人机来进行远程采访。

(3)信息可信度的验证

大数据在验证信息可信度上可以为记者提供很多帮助,其主要方法在于将信息与数据库进行比对,从矛盾或者不合逻辑之处验证信息的真伪。在新闻领域,目前此类应用主要有两种:一种是工具式的,比如谷歌搜索;另一种则是专题和节目式的,定期推出专题确认近期内重要的或影响较大的信息的真伪,以及指导记者进行识别谣言。

①核查工具

在这个“有图有真相”的读图时代,图片却未必是真实的,由此,一系列帮助人们核查图片真实性的工具应运而生。

比如,图片反向搜索引擎为记者们提供了一个搜索图片源头的最简单也最重要的路径。人们可以通过Google的图片反向搜索功能和TinEye这样的工具将图片与数据库进行比对,来核查其以前是否在网上出现过。

②核查专题(节目)

2011年,美国华盛顿邮报的一名编辑在参加一位政客的小型集会时,发现其和许多政客一样一直在误导听众,但是参与者似乎都没有意识到自己被误导了。为了解决这个问题,并为公众及时提供他们需要的信息,华盛顿邮报启动了名为TruthTeller的实时新闻核查项目。

这个项目旨在尽可能实时地核查政客们发表的演讲,主要采取以下步骤:首先从演讲视频中抽取出音频,然后将音频转换为文本,再将文本放入数据库中进行比对,并对事实进行核查。

类似TruthTeller的项目还有哥伦比亚大学数字新闻中心开发的数字信源核实平台Emergement,该平台将自己定义为实时的谣言粉碎机,除了关注政治领域外,还针对热门的事件进行核查,找出所有能搜集到的来源和最原始的出处,并列出在各来源中被分享的次数,最终打上True(真)、False(假)、Unverified(未核实)的标签。

2、新闻内容制作

无论是写作方式,还是呈现形式,抑或感觉体验,大数据对新闻内容制作环节的改变也是全方位的。

(1)自动化写作:机器人新闻

很多初学者,对大数据的概念都是模糊不清的,大数据是什么,能做什么,学的时候,该按照什么线路去学习,学完往哪方面发展,想深入了解,想学习的同学欢迎加入大数据学习扣群:805127855,有大量干货(零基础以及进阶的经典实战)分享给大家,并且有清华大学毕业的资深大数据讲师给大家免费授课,给大家分享目前国内最完整的大数据高端实战实用学习流程体系
 

机器人新闻是指通过计算机程序将一些数据融入结构化的语言,从而生成新闻报道或者个性化的文章。目前其主要应用领域是财经和体育两大类,因为机器人新闻写作的方式主要是先创造好模板,然后通过计算机程序获取数据后将其填入相关空格里。财经和体育等方面的信息比较程式化,自然成为机器人新闻率先介入的领域。

 

AutomatedInsight与NarrativeScience是开发这类机器人的主要技术企业。据统计,AutomatedInsight有超过3亿个模板可以供不同的新闻使用,它们在2013年就产生了3亿条新闻,比其他所有媒体加起来的还要多。

但在目前条件下,机器人新闻写作依然有极大的局限性。比如,程序生成的新闻模板痕迹比较严重,且语法生硬;人类丰富的情感,程式化的机器人难以习得和模拟;最重要的一点,机器人新闻难以写出深度内容,想要挖掘数据背后更深刻的关系,除了数据作为基础,还需要人工深入的采访调查。

(2)可视化呈现:数据新闻

数据与新闻的结合起源于20世纪中期在美国出现的计算机辅助报道(CAR),20世纪60年代兴起了精确新闻学。大数据时代下,数据资源丰富,可供挖掘的方向和领域也更多,数据新闻再次成为关注的焦点。

计算机辅助报道和精确新闻中,数据主要是信息源,多以支持观点和判断的论据出现,而大数据背景下的数据新闻中,数据成为新闻的本体,过去以文字为中心的新闻叙事方式被改变。不仅如此,为了顺应“读图时代”的受众需求,数据的可视化已逐渐成为目前数据新闻报道中不可或缺的重要环节。

成立于2012年的Ouartz,这是一家关注全球最新经济资讯的数字化新闻机构,主要为移动端的平板和手机而设计。除了重要的新闻事件报道之外,Quartz经常会做一些大数据的可视化新闻。社交媒体是数据的富矿,因而相继出现了很多专门针对各类社交媒体的数据进行分析的网站和工具。

有一些是帮助社交媒体用户了解自己账户情况的,也有一些针对大范围的数据分析与可视化呈现。针对Twitter的分析工具尤其多,如TweepsMap就是一个非常适合用户分析和可视化自己Twitter网络的工具,Twitonomy则是一个更为详细的分析用户Twitter博文的工具。

可视化为我们提供了直观的数据分析结果,便于理解和想象复杂的数据结构,不同的数据结构适用于不同的可视化表达方式,于是有公司开发了类似化学元素周期表的“可视化法周期表”,为人们做可视化提供了参考模板。这一周期表中列出了100种信息表达的可视化方法,鼠标悬停在每一种方法上都可以看到具体示例。

(3)沉浸式体验:虚拟现实和增强现实

目前新闻传播领域对于VR(虚拟现实)技术的使用主要在深度报道、突发报道和媒介事件三个方面。如,美国纽约时报2015年推出了手机应用NYTVR,并为订阅者邮寄发放了超过100万个谷歌纸盒式VR眼镜。

美联社也属于较早探索虚拟现实报道的媒体。2015年8月,美联社与RYOT合作了《寻找家园》(SeekingHome)项目,描述法国加来难民营的生活。为了进一步发展沉浸式新闻,美联社完全自主的VR360频道已经上线,目前该频道已经上传了9部虚拟现实和360°全景视频作品。

在深度报道中的应用比较成熟以后,突发报道和重大媒介事件直播成为目前VR重要的应用对象,国内目前关于VR的应用主要集中在这一领域。比如,深圳滑坡事故发生之后,新华社联合全景视频制作公司,乐视联合财新传媒的VR团队在第一时间奔赴救援现场,录制了救援工作的全景视频。

3、新闻内容分发

新闻内容的分发本质在于“信息与人”的匹配。用户时间有限,除了自己感兴趣的话题,要在海量信息中甄别有用或潜在感兴趣的内容很难,因而用户主动获取的信息只能是非常小的一部分。而移动互联网的发展使得推送越来越便利,大数据算法使得推送的内容越来越精准。目前,基于大数据的新闻内容分发产品已经非常多,但仍存在一定的差异。这一市场仍然处于初期,究竟哪种模式更有优势、更符合用户的需求还有待时间的检验。总体而言,目前的新闻内容分发产品根据算法的使用程度呈梯度分布:一是仰赖于与内容生产方合作或者编辑选择;二是人工与算法相结合的推荐方式;三是几乎完全依据算法推荐。

 二、大数据新闻的价值在何处?

1、唤醒:重构沉寂的历史数据

(1)对公共数据、原始数据的整合

大数据新闻报道最重要的数据来源就是那些来自政府、专业机构、社交媒体网站的公开数据。这些数据犹如沉睡的宝藏,等待有心人的挖掘。因此,如果具备敏锐的数据嗅觉,能够挖掘出公共数据、原始数据之间的关联,或者只是简单地进行历时性的梳理,就可以让这些尘封的数据焕发出新的生命力。

(2)对数据的二次加工和售卖

大数据新闻的价值来源于对混杂的、非结构化的数据的二次加工和关联挖掘,从中找出数据背后隐藏的故事的价值。在此基础上,这些经过精心处理的数据库本身,也可以成为媒体的再生价值,成为其他媒体或机构的数据

2、关联:连接当下的事实主体

大数据新闻的另一个功能在于透过纷繁复杂的数据,挖掘数据之间的关联性,通过事实找到当下主体的内在联系。比如说路透社于2013年2月推出的“关系中国”(connectedChina)报道,就是基于中国政府官方网站和出版物、中国及世界媒体报道、外国政府分析报告、学术论文等多渠道汇集的海量数据分析而成。

3、预测:把握未来的信息走向

正如前面提到的,未来的大数据新闻报道,将会更加侧重于数据驱动型深度报道和区域预测性新闻,利用大数据来预测事物的未来发展动向,满足受众的新闻期待。

4、“悦读”:展现信息可视化之美

除了上述三大功能,大数据新闻还能够提供更精准的监测环境,最大程度上消除社会的不安定感以及更丰富更新鲜的社会知识,满足受众的求知欲望。最重要的是,以上这些内容都可以通过提供更有趣的形式来呈现,同时不失严肃,这就是数据可视化图表给新闻报道带来愉悦的阅读体验。

 三、大数据新闻存在哪些缺陷?

大数据已经开始在新闻生产中大规模应用,但其本身存在一些先天性的缺陷和后天不足,值得警惕与反思。

1.数据的合法性

在新闻生产中,大数据在各个环节都扮演了重要的角色,其与隐私相关的最重要环节是个性化推送部分。当企业使用用户在各个平台上的行为数据来为用户提供更具个性化的推送时,用户所有的隐私都可能暴露无遗。在隐私权和个性化之间永远需要一个平衡。要想达到平衡需要多方的努力:技术上,发展加密技术;道德上,要求行业自律;法律法规上,在收集、存储和分析数据的软件中附上工程师们编写隐私政策的要求,并且加强政府监管。

2.数据的代表性

除了冗余数据太多、价值密度低外,大数据样本的代表性也值得商榷。大样本并不是全样本,甚至在绝大部分领域,它都不可能是全样本。来自于物理世界的科学数据和来自于人类社会活动的行为与关系数据,二者的产生和收集都存在很大的局限性,特别是社会生活中存在的“沉默的大多数”会大大影响到相关数据的全面。在新闻生产过程中使用大数据时,需要对所使用的数据保持审慎的态度,不能因为是大数据就笼统地认为它比传统的随机抽样调查更具代表性。

3.数据会说谎

人们通常认为数据真实客观,是不会说谎的,但事实可能正相反。大数据从来源上说就未必是真实的,互联网本身就充斥着大量的虚假信息——虚假的个人信息、购买的粉丝、雇人刷单的交易等等,我们不得不接受大数据里的这种虚假,这是网络本身的特性决定的。另一种虚假则相对容易避免,它主要是源于对于数据的处理、解读和呈现,对统计现象只看结果不重解释,很可能导致错误结论。

4.数据的解释性和预测性

大数据的解释力并不强,它只能说明相关关系,而无法表明因果关系。这恰恰与新闻的内在逻辑相悖,新闻倾向于得出结论,即由什么原因才引发这样的结果。新闻生产在应用大数据时需要规避这一矛盾,通过人工调查、采访、分析等手段完成自身的逻辑链条,从相关推进到因果。不仅如此,轻信大数据的预测也有一定的风险。这是个不确定的世界,有许多决定性的影响因素都无法纳入模型之内,过分依赖大数据及其预测模型是危险的。大数据依托的是已经存在的数据,是基于存量(过去)的;但新闻是向前走的,是基于变量(未来)的。两者存在逻辑上的差异。  

 

 四、大数据时代传媒业有哪些转型之路?

1、数据团队与部门融合:新闻编辑部的功能转变

在大数据时代,传统媒体要想转型成功,部门融合、协同合作是必不可少的。正如《纽约时报》的《创新报告》所倡导的,要“推倒新闻编辑室的墙”,加强采编部门和客户服务、技术应用与设计、数字挖掘、产品研发这些部门的合作,产品第一、部门第二要脱离过去采编部分独立于其他部门、只关注内容生产的单一模式,记者编辑也要参与到内容推广的流程当中,摆脱依靠广告和订阅赢利的落后模式,打造一个有吸引力的数字公司。

像赫芬顿邮报那样,把新闻采编环节和市场推广环节结合起来,以用户的需求作为媒体内容生产和机构改革的动力之一。简言之,就是要把各部门融合起来,让数据团队入驻新闻编辑部。此处所指的数据团队,就是基于部门融合、跨领域合作的数据新闻创作团队。

2012年首届国际数据新闻奖获奖作品的运行过程显示,数据新闻比拼的不是采访力量和团队规模,而更看重具有新闻敏感的人与具有数据挖掘、数据分析和可视化呈现能力的人之间的相互协作。大数据新闻的生产模式决定了头脑风暴和奇思妙想的重要性,部门与部门之间的界限日渐模糊,在“一个屋檐下”工作变得异常重要。

2、跨界合作与产业升级:大数据时代媒体机构的自我颠覆

除了促进编辑部与其他部门的融合,让数据新闻团队来参与新闻生产外,从媒体自我颠覆的层面来说,还需要加强与社会化媒体、移动互联网的合作,把不同行业、领域和终端的数据进行聚合,进行关联分析和价值挖掘,通过媒体融合及跨界合作,加速产业升级。

在大数据分析技术运用方面,新闻媒体还面临着很多挑战,数据的来源、挖掘和加工都需要专门的技术人才和设备。跨界合作,也许是比自己事必躬亲更适合的方式,不仅可以降低成本,而且可以通过合作碰撞出新的火花。

比如说“据说春运”就是央视与百度搜索合作制作的大数据新闻报道,央视负责专题选定和新闻制作,百度负责数据采集和挖掘,这对双方都是利好的事情,后来的“据说两会”“据说就业”等也证明了这种跨界合作的可持续性和良好的合作前景。

写在后面:

读完今天的文章,你需要掌握的知识点有4个:

1、大数据新闻有哪些应用形式?

2、大数据新闻的价值在何处?

3、大数据新闻存在哪些缺陷?

4、大数据时代传媒业有哪些转型之路?

如同报纸、电视、互联网等新技术一样,大数据也成为了能够深刻影响新闻业态的技术之一。大数据对新闻业态的重塑是渐行渐近的过程基于“开放、关联、对接”的互联网逻辑,不仅仅包括产业结构,还包括在生产理念、商业模式和用户体验等方面的革新。

很多初学者,对大数据的概念都是模糊不清的,大数据是什么,能做什么,学的时候,该按照什么线路去学习,学完往哪方面发展,想深入了解,想学习的同学欢迎加入大数据学习扣群:805127855,有大量干货(零基础以及进阶的经典实战)分享给大家,并且有清华大学毕业的资深大数据讲师给大家免费授课,给大家分享目前国内最完整的大数据高端实战实用学习流程体系
 

目前,虽然数据新闻还只是为传统新闻模式服务的新工具,与全新的新闻制作理念仍有很大距离,但只要继续在数据中探索、用数据讲故事、赋予新闻数据流般的生命,未来的新闻业必能更好地发挥李普曼所说的“聚光灯”和“探照灯”效应,为公众提出忠告、指南、通知和预警。

猜你喜欢

转载自blog.csdn.net/cqacby2798/article/details/83303005
今日推荐