数据灰色产业是否步入了转折点?

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/Z1Y492Vn3ZYD9et3B06/article/details/82719394

640?wx_fmt=jpeg


《卫报》和《纽约时报》发表了关于剑桥分析公司如何利用Facebook平台为5000万美国人建立侵入式数据库的文章,这些数据构成了2016年总统选举期间用于分析选民心理的基础。


这种获取和交易消费者数据的做法被称为数据灰色产业。第三方经常以篡夺消费者自身利益的方式利用这些数据。


面对大量的负面宣传,Facebook以及包括谷歌、Twitter等在内的其他科技公司可能会采取行动阻止数据灰色产业的进一步发展。


用户的个人数据是如何被获取的


剑桥分析公司经常向媒体吹嘘他们已经积累了数百万美国人的广泛数据库,据称这些数据库用来预测选民的心理状态,以支持那些想要左右潜在选民的选举候选人,该数据库的关键部分包括从Facebook帐户收集的数据。剑桥分析公司从一家名为GSR的公司购买了Facebook数据,该公司由剑桥大学心理学助理教授Kogan负责管理。 GSR是他管理的营利性实体,与其学术头衔无关。


Kogan博士通过在线调查积累了数据,并在一项名为机械土耳其人的服务上做广告。与众不同的是:Kogan博士要求广告团队的成员下载一个连接到Facebook的应用程序,这种情况下,他们必须允许Kogan博士访问他们的Facebook数据,以及他们的Facebook朋友网。


Facebook数据很有价值,因为它们包括真实姓名和电子邮件地址(只有少数用户阻止此类窥探)。这些信息用作匹配键以连接其他数据源,例如选举名单。


早在2015年和2016年,媒体就已经开始报道此类新闻了,《卫报》发表了相关文章,但Facebook反应非常慢。直到2016年,Facebook律师才告知Kogan及其同事,他们违反了Facebook的平台政策,要求他们删除数据。记者追踪了一些Facebook数据,举报人也提供了一些文件,事实证明,Facebook、GSR和Kogan博士对待数据灰色产业似乎都不太诚实,甚至在英国的一次听证会上,Facebook和剑桥分析公司的代表否认GSR曾在其工作中获得或使用过Facebook数据。


形成数据灰色产业的关键因素


上面概述的数据交易过程并非GSR或剑桥分析公司所独有。社交媒体生态系统中的许多其他公司都依赖于这种灰色产业。这种数据灰色产业形成的关键因素如下:


1.Facebook—— 流行的社交媒体平台是这场争议的核心,因为它建立了强大的数据库。对于想要了解用户喜好的营销人员来说,这个数据库非常有价值。这家社交媒体公司通过平台提供免费、有用的服务或便利,掌握了让用户分享个人数据的方法。这种机制为Facebook的数十亿收入提供了支持,并推动数据灰色产业的发展。


2.条款和隐私政策—— 在所有案例中,科技公司明确使用条款作为侵犯隐私的保护。这些条款隐藏在“如果你不同意我们的条款,你将不再使用我们的服务”之中,后来,许多公司转向更狡猾的策略,如“如果你继续使用我们的服务,我们假设你同意我们的条款。“这是一种勒索形式,很少有用户阅读这些条款和政策,但这些企业直截了当地声称他们已获得收集用户数据的许可。Facebook和剑桥分析公司认为这种获得用户许可的方法是完全合理的。Kogan博士显然向受访者披露了他们的数据可能被用于任何场景。由于他与剑桥大学的关系,一些受访者误以为他们正在参加学术研究。


3.诱导和转换—— 心理测试是收集每个受访者的Facebook数据的前端。 Facebook数据包含有关用户关系网的信息。同样,每个天气应用程序始终是用户位置详细数据库的前端。在我看来,Kogan博士想要的最重要的数据集并不是心理测试的结果,而是所有注册者朋友的姓名和电子邮件。因为调查涉及的几十万个受访者的信息不足以创建预测每个美国人心理状态的准确模型。


4.数据共享技术—— 这是一种典型的应用程序,通过提取各种数据源并集成,为用户提供服务。为了支持应用程序开发人员和Facebook等数据收集器之间的数据实时共享,数据收集器设置了应用程序可以下载数据的自动化流程。这些接口通常存在一定的成本,特别是当交付大量数据时,这是数据收集器的收入来源。由于这些系统允许自动连接,因此很难控制访问。


5.数据治理黑洞—— 一旦数据显示在一个数据库中,它必然会出现在许多数据库中以及第三方。如果数据到达第三方,Facebook就无法知道制作了多少副本,以及这些副本的位置。即使在Facebook内,有这么多员工可以访问数据,几乎不可能监控谁将数据复制到哪里。 虽然Facebook和其他社交媒体有社区规则将这些数据限制为非商业用途,例如改善用户体验,但Facebook只能知道哪些数据已发送给第三方,却无法知道第三方如何使用这些数据。


6.数据删除技术—— 正如在一台PC上消除文件一样,基本上不可能从数据库中删除所有数据痕迹。我们甚至无法计算和定位给定数据集的所有副本。因此,Facebook甚至懒得检查剑桥分析公司和选定的第三方是否删除了相关数据。直到媒体发现有证据表明该数据尚未被销毁,Facebook才暂停这家备受争议的公司在其平台上的活动。


7.监管和执法不力—— 欧洲可能最终准备制定法律来规范数据收集行业,但美国政府认为上文叙述的收集用户数据的方式是完全合理的。


现在,数据隐私以及数据交易引起了公众越来越多的关注,社交媒体平台对用户的隐私数据应该承担怎样的责任;当泄露用户数据时,平台又应该承担怎样的责任,这些问题逐渐被提上日程。也许,数据灰色产业正在面临着转折。



本文由中国软件网编译

原文链接:

http://junkcharts.typepad.com/numbersruleyourworld/big-data/page/2/


作者简介


陈雅妮 

中国软件网 行业分析师

云计算和大数据领域的研究咨询项目

 

微信:dq5642186470

邮箱:[email protected]


640?wx_fmt=png

点击【阅读原文】即可报名

猜你喜欢

转载自blog.csdn.net/Z1Y492Vn3ZYD9et3B06/article/details/82719394
今日推荐