高斯分布

  高斯分布,也称正态分布,又称常态分布。对于随机变量X,其概率密度函数如图所示。称其分布为高斯分布或正态分布,记为N(μ,σ2),其中为分布的参数,分别为高斯分布的期望和方差。当有确定值时,p(x)也就确定了,特别当μ=0,σ2=1时,X的分布为标准正态分布。μ正态分布最早由棣莫佛于1730年在求二项分布的渐近公式时得到;后拉普拉斯于1812年研究极限定理时也被引入;高斯(Gauss)则于1809年在研究误差理论时也导出了它。高斯分布的函数图象是一条位于x轴上方呈钟形的曲线,称为高斯分布曲线,简称高斯曲线

1809年,高斯(Carl Friedrich Gauss,1777—1855)发表了其数学和天体力学的名著《绕日天体运动的理论》。在此书末尾,他写了一节有关“数据结合”(data combination)的问题,实际涉及的就是这个误差分布的确定问题。

他的做法与拉普拉斯相同。但在往下进行时,他提出了两个创新的想法。一是他不采取贝叶斯式的推理方式,测量误差是由诸多因素形成,每种因素影响都不大。按中心极限定理,其分布近似于正态分布是势所必然。其实,早在1780年左右,拉普拉斯就推广了狄莫佛的结果,得到了中心极限定理的比较一般的形式。可惜的是,他未能把这一成果用到确定误差分布的问题上来。高斯的第二点创新的想法是:他把问题倒过来,先承认算术平均是应取的估计,然后去找误差密度函数条件下才能成立,这就是正态分布。一种概率分布。正态分布是具有两个参数μ和σ2的连续型随机变量的分布,第一参数μ是遵从正态分布的随机变量的均值,第二个参数σ2是此随机变量的方差,所以正态分布记作N(μ,σ2 )。遵从正态分布的随机变量的概率规律为取μ邻近的值的概率大,而取离μ越远的值的概率越小;σ越小,分布越集中在μ附近,σ越大,分布越分散。正态分布的密度函数的特点是:关于μ对称,在μ处达到最大值,在正(负)无穷远处取值为0,在μ±σ处有拐点。它的形状是中间高两边低,图像是一条位于x轴上方的钟形曲线。当μ=0,σ2=1时,称为标准正态分布,记为N(0,1)。μ维随机向量具有类似的概率规律时,称此随机向量遵从多维正态分布。多元正态分布有很好的性质,例如,多元正态分布的边缘分布仍为正态分布,它经任何线性变换得到的随机向量仍为多维正态分布,特别它的线性组合为一元正态分布。

正态分布最早由A.棣莫弗在求二项分布的渐近公式中得到。C.F.高斯在研究测量误差时从另一个角度导出了它。P.S.拉普拉斯和高斯研究了它的性质。

高斯这项工作对后世的影响极大,他使正态分布同时有了“高斯分布”的名称,后世之所以多将最小二乘法发明权归之于他,也是出于这一工作。高斯是一个伟大的数学家,重要的贡献不胜枚举。但现今德国10马克的印有高斯头像的钞票,其上还印有正态分布的密度曲线。这传达了一种想法:在高斯的一切科学贡献中,其对人类文明影响最大者,就是这一项。

猜你喜欢

转载自blog.csdn.net/hellocsz/article/details/79879834