统计特性和概率估计-1 (数学推导与证明)

其他 2019-02-17 22:01:06 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/shenziheng1/article/details/86767690

probabilistic & estimation：常用分布，共轭特性，最大似然估计，最大后验估计，指数族和自然参数
statistic properties：辅助机器学习算法证明，包括重要的切比雪夫不等式和马尔科夫不等式

1. 概率&估计-Probabilistic & Estimation

1.1 高斯分布与高阶矩

1-D高斯情况：

k-D高斯情况：

多元高斯函数的一阶矩(Fisrt Order Moment)-期望：

多元高斯函数的二阶矩(Second Order Moment) ：

现在，改变轴使得向量x-μ特征向量对齐：

1.2 一些重要的且常用的分布

我们要研究的大多数分布来源于指数族。指数族分布可以用自然参数e进行表示：

实际上高斯分布就是一种特殊的指数分布，1-D高斯分布证明如下。

Gamma分布与Inverse-Gamma分布(x<0, pdf=0不予讨论)

Gamma函数及其性质：

Gamma / Inverse-Gamma Distribution (a>0形状参数，陡峭参数； b>0尺度参数，散布情况):

Gamma分布其实并不是很常用，但是它衍生出的卡方分布、指数分布、T分布非常有用。

Wishart分布与Invert-Wishart分布

weight 分布

k-D Dirichlet 分布：

实际上k-D Dirichlet分布就是Beta分布在高维情形的推广。在贝叶斯推断中，Dirichlet分布作为多项分布的共轭先验得到应用，在machine learning中常被用于构建Dirichlet混合模型。

Beta分布：

machine learning中， Beta分布作为贝努利分布和二项分布的共轭先验分布的密度函数，广为应用。

Discrete分布

k-D 多项分布：

特例-二项分布：

Bernouli分布：

Poission分布：

1.3 二项分布Binomal与泊松分布Poission之间的关系

也就是说，当二项分布中的试验次数n比较大，事件A在一次试验中发生的概率p比较小时，二项分布的一个事件发生次数的概率可以用泊松分布的概率来模拟。

1.4 非指数族分布

非指数族分布通常可以利用两个指数族分布构建。例如较著名的Student-t分布：

1.5 共轭-conjugacy

首先考虑后验与先验之间的关系：

如果p(θ|X)和p(θ)的概率密度同属于一个分布，那么后验概率将非常好求。例如，如果先验以及似然函数服从高斯分布，那么后要也一定属于高斯分布。

在贝叶斯统计中，如果后验分布与先验分布属于同类，则先验分布与后验分布被称为共轭分布，而先验分布被称为似然函数的共轭先验。假定似然函数p(X|θ)是已知的，问题就是我们选取什么样的先验分布p(θ)，会让后验分布与先验分布具有相同的数学形式。共轭先验的好处主要在于代数上的方便性，可以直接给出后验分布的封闭形式，否则的话只能数值计算。共轭先验也有助于获得关于似然函数如何更新先验分布的直观印象。

这里需要特别补充的是所有指数家族的分布都有共轭先验。

1.6 最大似然估计 Maximum Likellihood Estimation

案例： 1-D 高斯

假定我们相信数据是服从高斯分布的。很明显蓝色的高斯分布曲线比绿色的高斯分布曲线更合理。但是这里我们需要用最大似然函数估计来解释为什么。

为了将乘法运算简化成加法运算，这里我们采用对数似然函数log-likelihood-function。上式转化为：

接下来分别对均值和方差分别求偏导等于0，就可以获得最大似然对应的参数。

1.7 最大后验 Maximum A Posterior-MAP

案例： 1-D 高斯

对于上面的问题，假设我们对μ有相同的先验知识，也就是说μ也服从高斯分布。那么这一类的估计称为最大后验MAP：

对于高斯情况，我们同样可以采用求偏导等于零，获取最大值对应的参数。

猜你喜欢

转载自blog.csdn.net/shenziheng1/article/details/86767690

统计特性和概率估计-1 (数学推导与证明)

统计特性和概率估计-2 (数学推导与证明)

AdaBoost的证明和推导

无偏估计的数学证明和分析

常用离散型随机变量的概率分布表（附概率和为1、期望、方差的推导与证明）

常用的数学不等式和证明

DCT和DFT的关系以及MDCT的推导证明

GAN的数学推导和案例应用

GAN的数学推导和案例应用

机器学习中常用的数学公式推导（概率论与数理统计）

HDU - 5985（Lucky Coins ）数学·概率·公式推导

D - Dinner Bet（概率论 dp 数学推导）

数学基础详解——概率论与数理统计2（参数估计）

【数学基础】概率统计

程序员的数学2概率统计1

常用连续型随机变量的概率分布表（附概率密度函数全域积分等于1、期望、方差的推导与证明）

样本方差之n-1理论推导及计算机实验证明

【HDU2086】A1 = ?：数学表达式推导

BZOJ 2956 模积和 (数学推导+数论分块)

关于梯度下降法和牛顿法的数学推导

Adaboost的简单理解和详细数学推导

【数学和算法】卡尔曼滤波五个公式推导

采样定理的证明与推导

Lucas定理——推导及证明

概率统计笔记之 “数学期望和方差”

中学数学证明所有自然数和为-1/12

机器学习中数学(10)——先验概率,后验概率,似然函数和极大似然估计

【BZOJ3244】树的计数（NOI2013）-概率期望+数学证明

数学基础之概率统计

(泰勒展开式/欧拉公式)证明：e^x推导及e^(iπ) = -1展开过程

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)