AI从零开始之统计学简介

今天我们来看一下统计学主要是干些什么,在大家深入了解之前能够有一个感性的认识。

要想感性(呃,不是性感),那最好的方法肯定是举个例子来说明了。我们经常说上学无用论,所谓有用无用,粗俗点理解就是能不能赚钱,现在我们假设知道了一些学历(或者说学习年数)和收入的数据,他们如果画图的话就会显示成下面的图一所示:


图一 收入和学历之间的关系图

现在我们假设收入就只和学历之间有关系,我们把收入写成Y,学历这里置为X,那么我们认为YX之间其实是有一个关系的,用公式表示如下:

Y =f(X) + Ɛ

这里的f就是我们认为的一个固定的但是我们不知道是什么的关于X的函数,Ɛ是一个误差项,这个误差项和X是没有关系的,并且误差的平均值应该是0

回到我们的例子上来,我们来看图二,中间的蓝色的线就是我们假设存在的f,每个点的垂直的线就是用来表示Ɛ的,我们可以看到Ɛ有时是正的,有时是负的,所以总的来说,它的平均值接近为0


图二 收入和学历之间的的fƐ

通常来说,其实收入可能和多个输入有关,不仅仅是学历,比如和经验也有关系,如图三所示,我们可以看到一个收入和学历,经验之间的关系图。


图三 收入和学历,经验之间的关系图

从这个来看,我们可以发现其实X并不是一个元素,而应该是一系列的输入:X = (X1,X2…Xp),这里的每一个X就表示一个输入,比如X1是学历,X2是经历等等。

那统计学究竟是干什么的呢?统计学其实就是一系列方法,这些方法是用来估计f的。所以,通俗地讲,我们都是为了这个虚无缥缈的f来进行奋斗的,哈哈。

猜你喜欢

转载自blog.csdn.net/u011960402/article/details/80387461