Fake news on Twitter during the 2016 U.S.presidential election 读书报告

《Fake news on Twitter during the 2016  U.S. presidential election》 读书报告

                                                                                                                           

  • 论文题目:

论文题目:Fake news on Twitter during the 2016 U.S. presidential election

作者:Nir Grinberg1,2*, Kenneth Joseph3*, Lisa Friedland1*,

Briony Swire-Thompson1,2, David Lazer1,2

出版社:Science (New York, N.Y.)

年份:2019年

  • 论文提要:

        2016年总统大选后,假新闻在社交媒体上的传播成为美国公众关注的焦点。本文检查了Twitter上注册选民对假新闻的曝光和分享,发现与假新闻来源的接触行为都非常集中。仅1%的个人用户就占假新闻来源曝光的80%,而0.1%的个人用户占假新闻来源分享的80%。最有可能与假新闻来源接触是有着保守的倾向,年龄较大,而且高度参与政治新闻的个人用户。且一些假新闻来源有重叠的极右倾向受众。尽管如此,对于政治领域的人来说,大多数政治新闻曝光仍然来自主流媒体。

  • 论文内容简述:

前言:通过讲述假新闻与公众之间的联系,引申出本文中心内容:了解假新闻在社交媒体的定位及受到其影响的受众的特征。

数据定义(假新闻来源):定义假新闻来源为:“具有合法制作新闻标签的新 闻媒体,但“缺乏新闻媒体的编辑规范和流程来确保信息的确性和可信度。”并据此将假新闻来源网站划分为3类。

Twitter上的选民:以选民记录上部分Twitter用户作为样本组。并定义了计算小组政治网址曝光率的方式。将其分配到五个政治亲和子群中:极左(L *),左(L),中(C),右(R)和极右(R *)。少于100次政治网址曝光的人被分配到一个单独的“非政治”小组。

结果(流行度和集中度):通过分析小组内假新闻来源的曝光与分享情况,得出假新闻的曝光和消费高度集中于少数成员和网站。并在后续分析中,剔除了小组内SS-F账户数据(负责假新闻分享和曝光80%以上的账户,可能是cybrogs)。

谁曝光过假新闻来源:通过对每个政治团体匹配的二项回归,得出个人信息源中假新闻来源所占比例与其年龄、对政治的关注程度显著正相关。且右翼团体整体比左翼高。其他因素如:白人、男、摇摆州、发推次数多也有影响比例增加,但幅度小。

谁分享了假新闻来源:通过回归模型和模拟曝光后政治推文的分享率,得到政治推文数量、假新闻曝光水平、政治亲和力都与假新闻分享率正相关,且曝光推文与用户倾向是否一致是决策用户分享的主导因素。

假新闻和媒体生态系统:通过建立共曝光网络,得到政治总曝光最高的媒体来自主流媒体,而假新闻曝光大多集中于右倾媒体中,虽然仅占右倾媒体总曝光一小部分,但仍然形成了一个独特的网站集群,其中许多是虚假的,被严重重叠的个人受众消费,且这些人大多右倾。

讨论 :假新闻内容占总内容比例很低,但其来源和用户集中程度值得注意。并点明研究中心需注意的亚群体:老人和cybrogs。最后得出抑制假新闻传播的方法:社交媒体平台阻止用户关注或分享来自少数几个最普遍的虚假新闻来源的内容;采取抑制频繁发布的政策,这是有效的防洪技术,同时只影响少数账户。

  • 论文分析

        本文以16年大选时大热一时的”Fake news”为主题,将Twitter上的部分注册选民作为研究Fake news影响的样本小组,并额外引入了属性:政治派别。并通过统计小组成员两个行为:曝光和分享。得到了假新闻来源和受众的规模范围和属性。并通过这些属性得出了解决假新闻传播的方法。

        本文成功地演示了一次Data mining的过程。从定义问题为了解虚假新闻在社交媒体平台的定位,到建立数据挖掘库:Twitter上的注册选民信息,(包含异常用户cybrogs)。然后分析数据:找到最具有代表性的属性:分享和曝光水平。随之建立分析模型:包括不同类别假新闻来源的时间-日曝光率柱状图、小组成员网站曝光率分享率经验累积分布函数图、异常账户政治网址曝光和分享的结构柱状图、政治亲和团体单独匹配的二项回归,还有站点共曝光聚类网络等。最后通过模型得到有效信息,进一步解答初始问题,并给出解决措施。

        本人认为本文的创新点在于将Twitter账户与选民信息相关联,引入政治派别这样的属性。并且定义了曝光和分享这两个衡量网址影响度及账户影响度的概念。发布推文的用户有多少追随者意味着则该推文有多少曝光次数。曝光程度高意味着该账户影响力大。而分享次数高则意味着该推文频繁发布于网络。正是通过这两个定义,以及数据分析得到的假新闻来源和受众的结果。才有最后抑制假新闻传播的措施:社交媒体平台阻止用户关注或分享来自少数几个最普遍的虚假新闻来源的内容;采取抑制频繁发布的政策。此外,由于假新闻来源共享受众,平台可以与事实核查组织建立更密切的合作伙伴关系,以主动观察错误信息的顶级生产者,并检查出现在假新闻来源附近的新网站的内容。

 

  • 心得体会

        这是我本科毕业之后,所写的第一篇读书报告。可能在格式或内容上还有欠缺,用词可能也不是很准确。但是这篇略显粗糙的报告却花了不少时间,因为阅读文献不多,没有办法学会有重点地去读,我还是采取了笨办法:从前至后,看完标题看内容。而全英文的内容的确带来了一些阅读困难,为了阅读顺畅,我先大致理解内容后,进行了翻译。在翻译过程中,一些遗漏或者之前迷惑的点也随之完善。但我清楚,之后的学习生涯所需要阅读的文献更多,这种方式不可行,所以我需要加强阅读能力。

        此外,我在精读的《Fake news on Twitter during the 2016 U.S. presidential election》论文以后感触颇深,了解了专业论文的书写格式、语言的连贯性、推理的逻辑性。通过这篇论文内容做思维导图,也让我明白了研究的大致流程。并且这篇文章蕴含数据挖掘以及信息安全两方面的内容,这让我对之后学习的方向有大致了解。

       它从2016年选举大热一时的“Fake news”入手,结合时事将线下数据与线上数据加以结合处理,并提炼新的属性来衡量数据,从多种分析模型得到有效信息,并从信息得出处理措施。这看似简短的文章,却包含了很多高阶技巧。让我很受启发,受益匪浅。

  •     脉络图

 

发布了158 篇原创文章 · 获赞 34 · 访问量 8万+

猜你喜欢

转载自blog.csdn.net/qq_40421671/article/details/100515131