机器学习储备(2):高斯分布

今天讲解独立同分布的概念,高斯分布,一维高斯分布。

1、独立同分布

指随机过程中,任何时刻的取值都为随机变量,如果这些随机变量服从同一分布,并且互相独立,那么这些随机变量是独立同分布。

先说说独立这个概念。在预测德克萨斯州区域的房屋价值时,房屋样本x1和样本x2之间的预测是相互独立的,它们之间不存在任何关系,这也是接近实际的。

同分布是指预测的房屋都是来自于德克萨斯州这块区域的,你不能拿北京的某个小三居扔到这个模型中去做预测吧,如果非要这样,误差一定会很大。

2、高斯分布

高斯分布(Gaussian distribution), 又称为正态分布(Normal distribution),是一个非常重要在各个领域有广泛应用的概率分布。

正态曲线的特点是中间高,两头低,左右对称,人们经常称之为钟形曲线。

若随机变量X服从一个数学期望为μ、方差为σ^2的正态分布,记为N(μ,σ^2)。

其概率密度函数为正态分布的,期望值μ决定了它的位置,标准差σ^2数据的偏离程度。

当μ = 0,σ = 1时的高斯分布又称为标准正态分布。

3、一维正态分布

若随机变量服从如下的概率密度函数,则表明是一维正态分布。

当然,还有多维正态分布,在此不做详述。

猜你喜欢

转载自my.oschina.net/u/3994209/blog/2870209