什么是大数定律?

目录

1 小数定律

2 什么是大数定律

3 小数定律和大数定律的动态演示


要理解大数定律,就必然先要理解小数定律。我会从下面3个方面聊聊:

1)什么是小数定律?

2)什么是大数定律?

3)小数定律和大数定律的动态演示案例

1 小数定律

喜欢总结规律是人类的天性。例如,人们抱着娱乐或者认真的态度总结了世界杯足球赛的各种“定律”,其中比较著名的有“巴西队的礼物”。

“巴西队的礼物”是指:只要巴西夺冠,下一届的冠军就将是主办大赛的东道主,除非是巴西队自己夺冠。

我们来看下历史下真实的数据:1962年巴西夺冠后,4年后英格兰在本土称雄。1970年巴西三夺金杯,1974年轮到东道主西德捧杯。1994年巴西在美国夺冠,下一届东道主法国队在本土夺冠。1958年,巴西队在瑞典夺冠,4年后他们未免成功,收回了“礼物”。

看起来这个定律很有意思,但是这一定律在2006年被打破。

2006年在德国的世界杯,德国和巴西队都没有夺冠,而是由我们中国人耳熟能详的主队里皮率领的意大利队夺冠。

还有一些未被打破的定律,这些看似没有规律的神奇定律,之所有神奇,完全纯属巧合。

世界杯每4年举办一次,总共才举办了20多届。只要数据足够少,我们总能发现一些神奇的定律。

如果数据少,随机现象可以看起来很不随机。甚至非常整齐,好像真的有规律一样。

那么,什么是小数定律呢?

小数定律是说,如果统计数据很少,那么事件就表现为各种极端情况,而这些情况都是偶然事件,跟它的期望值一点关系也没有。

比如人们知道投硬币出现正反面的概率都是50%,于是在连续出现了5个正面以后,却倾向于下一次出现的反面概率较大。

这就好比盲人摸象,你看到的只是偶然事件。

所以,理解“小数定律”最大的一个好处就是你不会再轻易地大惊小怪了,也不会有个人偏见了。

如果统计数据不够大,那就什么也说明不了。

正因为如此,我们才不能只凭自己的经验,哪怕加上朋友和家人的经验,去对事物进行判断。我们的经验特别有限。别看个例,看大规模统计。

小数定律里的“跟它的期望值一点关系也没有”,这里的期望值就是我们后面所聊到的“大数定律”。


2 什么是大数定律

大数定律就是我们从统计学中推测真相的理论基础。

大数定律说如果统计数据足够大,那么事物出现的频率就能无限接近它的期望值。

那么,什么是事物的期望呢?

某个事件的期望,也就是收益,实际上各种不同结果出现的概率乘结果的收益的和。

拿我们最熟悉的投色子举例,游戏规则是投中1点获得1元,投中2点获得2元,以此类推。

那么,这个事件的期望是多少呢?

显然是:

1\times 1/6+2\times 1/6+3\times 1/6+4\times 1/6+5\times 1/6+6\times 1/6=3.5

这个期望3.5代表什么意思呢?

也就是说,只要你一直玩下去,你每次游戏的预期收益是3.5元。可能你某次赢了1元,某一次赢了6元,只要你长期投下去, 你平均下来每次就赢3.5元。


3 小数定律和大数定律的动态演示

下面是前面投色子的动态演示过程,横轴代表投色子的次数,纵轴表示期望值。

你会发现,当抛色子次数少时,期望波动很大,这就是小数定律,如果统计数据很少,那么事件就表现为各种极端情况,而这些情况都是偶然事件,跟它的期望值一点关系也没有。

但是当你抛色子次数大于60时,就会越来越接近期望值3.5。这就说明了,如果统计数据足够大,那么事物出现的频率就会越来越接近它的期望值。

粗略看一下,抛出色子点数是3.5似乎是一个无效数据,因为色子的每一面都是整数,不会出现小数。

但是,期望是一个非常有用的参考数据。就像我们刚刚说的抛色子游戏,你可以通过比较成本投入和期望收益,你就能知道这件事情值得不值得。

如果每玩1次需要缴纳5元,那么你玩1万次,你投入是5万元,那么你的收益将是3.5万元。显然,你已经知道你要是玩1万次的结局了。你必然会输掉1个带有1080ti显卡的主机。

本篇博客是基于知乎上猴子的回答,进行的整理。非常感谢猴子的讲解。

猜你喜欢

转载自blog.csdn.net/qq_32572085/article/details/88934746