Facebook教你如何玩转大数据

概念是不是个陷阱,我们的时代,互联网巨头坐拥海量信息是无人可以否认的事实,社区产品和社交产品赖以生存的基础就是从用户那儿来的数据。

他们都是怎样八仙过海、各显神通让你感受到大数据的?比如,去年年终的时候,你肯定看到众多好友在微信朋友圈儿分享了一张“订制”的图片,在微信产品成长历程的时间轴中标注你加入的时点;你可能在登录豆瓣电台后,才发现通过一个特别的回忆通道,豆瓣已经帮你记录了一年来的音乐足迹,从哪天注册哪天听第一首歌哪天听的很悲伤……无一遗漏;如果你是知乎用户,你肯定搭乘了一架“时光机”,直到这时一组组数据才让你猛然发现,你曾经写下的回答已经被上万的人分享……
  
这些贴心而极具煽情功效的产品背后,就是基于数据挖掘的最基本形态。这些体贴的数据化产品,常常为你一边绞尽脑汁写年度总结一边担心年底红包缩水的灰暗生活提供些许慰藉(支付宝的账单除外,这差不多是提醒了“过去一年造了太多孽”的恐吓信吧……)
  
你知道SNS霸主Facebook是怎么玩转大数据的吗?Facebook知道你什么时候跟别人约会,什么时候分手——对,就这么简单。
  
和传统线下结为恋人的过程类似,社交网络的用户确立恋爱关系也会经历所谓的“求爱”阶段。Facebook的科学家卡洛斯·迪乌克(CarlosDiuk)透露,沿着时间轴观察,在一段网恋的求爱期,两位Facebook用户的发帖都会增多。而一旦真正认准了对方就是意中人,两人在对方Facebook留言板上发的帖子都会减少。原因可能是共浴爱河的恋人花了更多的时间线下相处。
  
迪乌克这样用数字来解释上面的一切:
  
我们通过大量数据发现,在成为恋人之前的100天里,日后坠入情网的两人相互发帖缓慢地逐步增加。假设恋情正式开始的那天是“第零天”,这类帖子的数量是从“第零天”起越来越少。我们发现,“第零天”以前发帖最高峰的12天里,平均每天发1.67贴;而“第零天”以后发帖最少的85天里,平均每天每天发布1.53贴。
  
再加上点儿常识和心理学分析,解释这个现象就更简单:恋人之间求爱结束以后,双方共处的时间增加,线上互动就给线下现实世界的互动让位了。
  
迪乌克说,数据还显示了另一个有趣的趋势,即在告别单身之后,情侣之间普遍爱意大涨,互动的内容会越来越甜蜜,传递正能量。正如Facebook的下图趋势线所示,在第零天和第零天之后的第一天,恋人之间发帖数量剧增(比对上图)。
  
活跃用户规模已经达到2.7亿的Facebook掌握了数以亿计的这类用户信息。而Facebook这项分析的数据收集对象是2010年4月到2013年10月之间宣布恋爱满周年的情侣用户,并未包括这期间恋爱关系有变的用户。在分析恋人们彼此多相爱的时候,主要针对英语用户。
  
迪乌克的同事、Facebook数据研究团队的另一位科学家格登·史塔特(BogdanState)还透露了两项好玩儿的发现:
  
第一、如果通过Facebook发展的一段恋爱关系能维持三个月以上时间,很可能会持续四年甚至更久;
  
第二、恋人分手可能性最大的月份是5月、6月和7月。
  
这显然是快要取代心理学专家和搞社会调研的那群人的饭碗的节奏了。
  
不过你可能会说,这种研究差不多也算情人节营销吧?不瞒你说Facebook还真的是喜欢利用情人节档期来玩转数据分析。
  
早在2012年始,Facebook的数据研究团队就开始利用用户主动公开感情的数据做出一些有趣的尝试。2011年底,Facebook开始让用户在社交网络上分享自己(数据来自Spotify插件)的收听习惯,Facebook的数据工作团队也同一时间开始工作。
在这里我还是要推荐下我自己建的大数据学习交流qq裙:522189307 , 裙 里都是学大数据开发的,如果你正在学习大数据 ,小编欢迎你加入,大家都是软件开发党,不定期分享干货(只有大数据开发相关的),包括我自己整理的一份最新的大数据进阶资料和高级开发教程,欢迎进阶中和进想深入大数据的小伙伴。上述资料加群可以领取

猜你喜欢

转载自blog.csdn.net/bigagag/article/details/90139451