《爆发·大数据时代预见未来的新思维》笔记与心得

马克·吐温曾说过: 历史不会重演,却自有其韵律

           虽然万事皆显出自发偶然之态,但实际上它远比你想象中容易预测。

在日常生活中,虽然我们可以针对某些事情自由做决定,但似乎人生的大部分时光还是 处于“无人驾驶”状态。人类社会从资源丰富走向资源匮乏,从战争回归和平,又在和平中爆 发战争。这一切不禁引起大家的思索:人类发展究竟有没有遵循潜在的规律,遵循那些并非 人类自创的规律?

书的目标-无规律运动的规律之处

人类行为中更深层次的 规律,并确证这些行为是能够被探究、被预测,而且无疑是能够为人所用的

               通过研究,大家会看到生命的韵律,会发现人类行为中更深层次的 规律,并确证这些行为是能够被探究、被预测,而且无疑是能够为人所用的。有了这些四处搜集来的信息,我们不会再把人类的行为视为互不相关、随意偶然的独立 事件。相反,它们应该是相互依存的奇妙大网的一部分,是相互串联的故事集中的一个片段。 它们会在不经意时显示次序,在意想不到之处偶然出现。我们观察得越仔细就越容易发现, 人类行为遵循着一套简单并可重复的模型,而这些模型则受制于更加广泛的规律。

人类运动轨迹的本质

              类似悬浮在水中的花粉微粒的运动,人类大部分时间也是运动不止。不同的是,人类不是受到微小而不可见的原子的 撞击,而是被转化成一系列任务、责任以及动机的不可见的神经元的颤动所驱使。我们的活动轨迹可能跟布朗显微镜下的花粉所做的 曲线运动一样不可预测。

数据让追踪成为可能

               如果真有透视未来的千里眼,历史真的不会重演,人类的动机和欲望也不会重复吗:我 们总是想要更好、更多、更不一样的东西?

例如:天气预测问题

方法一:“天气预测是在假设以前的气候状况会重复的基础上进行

方法二:物理学家理查森很久以前就发现还有一种更好的预测方法。1913 年,流体 运动方程已经公之于世。所以,如果知道当下的天气状况,原则上你就能推测出随后的大气 变化。这就意味着,利用物理和数学知识,他就能预测第二天的天气情况

数量增多减少犯错概率

             陪审员越多,错判概率越小。 我们相信没有人能总是做出正确的决定,尤其是那些会影响到我们自由的人。


             例如:我们假设一名陪审员有 80%的时候能看到真相,但他还是有 20%的出错机 会。所以,你肯定不想把自己的自由押在一个陪审员的手上。但如果有 12 个陪审员,虽然 每个人出错的概率仍是 20%,但你被冤枉的可能性只有(0.2)12,也就是 0.0000004 的概率。 这就意味着 12 名陪审员参加 5 亿次审判才有一次冤枉被告的可能。

泊松的悖论

              泊松的计算在哲学层面上存在一个深层假说:他荷载取值,假设人类行为是随机的,将 事情简化了。不管你是最聪明的智者,还是最愚笨的傻瓜;不管你是法官,还是犯人;不管 你是怀疑论者,还是迷信的信徒,一旦坐上陪审席,我们知道的只是你做出正确裁决的概率 只有 90%。这也就是说,泊松将不可预测性和偶然性等同而语了。他接着指出,一旦我们承 认人类行为是最随机的,它突然之间就可以被预测了。

  • 爆发洞察

         这似乎是个悖论:如果不可预测性是指偶然性,那么偶然性又怎么能预测呢?答案很简 单:泊松所谓的预测跟我们日常生活中追求的有所不同。类似爱因斯坦推导原子运动规律。爱因斯坦知道推测出 单个原子的运动轨迹是不可能的,所以转而假设原子的运动是随机的,然后推导出原子离释 放点的距离遵循扩散理论。


          同样,泊松根本没去想陪审员是否做出了正确裁定,而是假设每个陪审员都像掷骰子那 样投票:他们大部分时间是对的,但偶尔会出错,而且我们永远无法知道他们什么时候是对 的,什么时候是错的。在这一假设的前提下,泊松利用定罪率的统计数据推导出了整个陪审 系统的可靠性。


         为了更好地理解泊松的推导过程,我们先说说我的电话记录。
           我平均每天打 12 通电话,也就是说差不多每两个小时就会打一次。不过,根据这些你 并不能推导出我将在何时打电话。但是,如果假设我打电话的模型是随机的,你就会对我的 通讯问题有所了解。利用泊松的公式,你可以推算出我下个小时不打电话的可能性(这个概 率是 60%——也就是可能性很大),或者我连续打 5 通电话的可能性(概率是 0.02%——不太 可能)。利用他的公式,你也能推导出我一天之内不打电话的概率(0.001%——可能性极小)

  • 例子

          目标:一家电话集团的某个工程师负责测定在你所居住的小区安装的移动电话信号塔的 容量。

          风险:

  1. 如果他设定的容量过低,很多电话就会掉线,用户和老板都会很不高兴;
  2. 如果设定的 容量过大,就会浪费公司的资源,不用说肯定也会惹恼老板。

         但如果这位工程师精确地知道 你所在社区中每个人计划使用电话的时间,他就能预测出何时是高峰期,也就能计算出信号 塔的容量最大值。

         但工程师不可能知道你将来的通话情况。不过,他知道每个用户平均每天要打 3 通电话。 同时,他假设所有人的通话模型都是随意的,那么利用泊松的公式,他就能推测出任何时间 点计划使用电话的人数。然后,他就可以设定足够大的容量,使得 100 部电话同时使用时掉 线的电话不超过 3 部,以确保公司达到“无瑕疵”的移动服务的基准。

  • 泊松规律应用
  1. 意外的发生遵循泊松规律,泊松理论自此便成了保险业的基本理 论。
  2. 如今,在假设受随意浏览和通信模型影响的网络通信量遵循泊松过程的条件下,人们设 计了路由器。
  3. 被用来计算因传染病死亡的人数,以及预测每个家庭得伤寒的人数。

          ps: 与此同时,科学家们仍默然接受人类行为科学的基本范式:我们的行为实际上是随意的、 不可预测的、偶然的、无法确定的、不可预知的,以及无规无序的。

 每个人都是习惯的奴隶

 要想预知未来,必先了解过去

  • 爆发的频率:熵          

          如果丹尼尔每个工作日都是上午 8 点开始工作,中午在同一个餐厅吃午饭,然后在下午 6 点左右下班,并在家里一直待到第二天早上,那么他未来的行踪对我们而言就没什么秘密 可言了。用物理学或信息科学的术语来说,丹尼尔的熵就是零。换句话说,他的行踪是完全 能被预测的。相反,利用随机数生成器做决定的哈里昆人的熵就趋于无限大,如此一来他们 的行踪就是完全不可知的。         

           尽管数据显示我的可预测程度很高,但熵值低并不会禁锢我的未来——只有当你知道我 的过往历史的时候,你才能做出预测。另外,如果我的熵值很高,我的过去并不能说明未来 会怎么样;如果我的熵值很低,我的行为会很容易被预见,但这只是在你了解我过往行踪的 情况下才能实现。这反映了一个很浅显俗套的道理:要想预知未来,必先了解过去。

数据,是一把双刃剑 

  • 越是相互依赖,隐私期待就越少 

        一窥掌管我们隐私的一个基本方程: 一个社区里的人越是相互依赖,对隐私的期待就越少。人们越是需要家人和朋友,就越

难以对某件事守口如瓶。只有在信赖金钱化的北美和西欧,人们才会要求独处的权利。 如今,越来越多的研究表明,幸福和健康的关键取决于我们的朋友的数量和质量。所以,谁说我们做的就一定对?我们的隐私是不是拿幸福换来的呢?

  • 没有隐私的未来 

         在美国,我们经常会向公司透露我们的个人信息。作为交换,我们能获得一些真正的或 认知上的利益,比如产品或服务的打折。然而,如果我们意识到政府正在搜集我们的个人信息,我们又会齐声抗议。欧洲干脆就顺着人们:法律明文禁止企业之间分享客户的个人信息, 但欧洲联盟法规定所有通信公司都必须将客户的信息(包括个人的行踪和通信记录)保存 6 个月到两年时间,并与政府分享。 

  • 大数据时代的隐私保护 

         预测个体的行为已经变得非常容易了。未来比过去更具价值,因为我们的旅行和购物计划可能是商业圈中最有影响力的商品。虽然我们的过去由安全防火墙 和隐私法保护着,但通过精密系统的预测,我们的未来却极易被人掌握。基于此,我想出了 一个新的模型并称之为“准隐私”。简单地说就是:谁掌握着我们未来行为的信息?谁又会从 中获利? 

猜你喜欢

转载自blog.csdn.net/wodeyijia911/article/details/85058739