似然与似然函数

似然和概率两者是互为相反关系的，概率描述了已知参数时的随机变量的输出结果；似然则用来描述已知随机变量输出结果时，未知参数的可能取值

概率是已知参数来求解P（针对事件发生）
似然是已知样本来求解参数（针对参数，是给定联合样本值X=x下关于(未知)参数theta 的函数

一种方便区别是概率还是似然的方法是，根据定义，"谁谁谁的概率"中谁谁谁只能是概率空间中的事件，换句话说，我们只能说，事件(发生)的概率是多少多少(因为事件具有概率结构从而刻画随机性，所以才能谈概率)；而"谁谁谁的似然"中的谁谁谁只能是参数，比如说，参数等于 alpha时的似然是多少。 即：事件的概率，参数的似然

PS:概率是已知模型和参数，推数据。统计是已知数据，推模型和参数

似然函数：（用于参数估计）
P(x|θ)
1.对于离散数据而言（一般来说ML中的数据都是离散的，因为dataset都是有限的（x,y)对）
P(x|θ)=连乘P(xi)
2.对于连续数据
P(x|θ)=连乘f（xi）
期中θ是需要估计的参数，x是具体的数据也就是样本

如果θ是已知确定的，x是变量，这个函数叫做概率函数(probability function)，它描述对于不同的样本点x，其出现概率是多少。
看上面对于概率的叙述，属于已知模型和参数对时间进行预测分析

如果x是已知确定的，θ是变量，这个函数叫做似然函数(likelihood function), 它描述对于不同的模型参数，出现x这个样本点的概率是多少。
属于已知具体样本数据，对于模型的参数进行分析预测

例如，f(x,y)=xy, 即x的y次方。如果x是已知确定的(例如x=2)，这就是f(y)=2y, 这是指数函数。如果y是已知确定的(例如y=2)，这就是f(x)=x2，这是二次函数。同一个数学形式，从不同的变量角度观察，可以有不同的名字。

而对于极大似然估计就是找到这个theta值使似然函数最大

——参考文章：

详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

猜你喜欢