似然与似然函数

似然和概率两者是互为相反关系的,概率描述了已知参数时的随机变量的输出结果;似然则用来描述已知随机变量输出结果时,未知参数的可能取值

概率是已知参数来求解P(针对事件发生)
似然是已知样本来求解参数(针对参数,是给定联合样本值X=x下关于(未知)参数theta 的函数

一种方便区别是概率还是似然的方法是,根据定义,"谁谁谁的概率"中谁谁谁只能是概率空间中的事件,换句话说,我们只能说,事件(发生)的概率是多少多少(因为事件具有概率结构从而刻画随机性,所以才能谈概率);而"谁谁谁的似然"中的谁谁谁只能是参数,比如说,参数等于 alpha时的似然是多少。 即:事件的概率,参数的似然

PS:概率是已知模型和参数,推数据。统计是已知数据,推模型和参数

似然函数:(用于参数估计)
P(x|θ)
1.对于离散数据而言(一般来说ML中的数据都是离散的,因为dataset都是有限的(x,y)对)
P(x|θ)=连乘P(xi)
2.对于连续数据
P(x|θ)=连乘f(xi)
期中θ是需要估计的参数,x是具体的数据也就是样本

如果θ是已知确定的,x是变量,这个函数叫做概率函数(probability function),它描述对于不同的样本点x,其出现概率是多少。
看上面对于概率的叙述,属于已知模型和参数对时间进行预测分析

如果x是已知确定的,θ是变量,这个函数叫做似然函数(likelihood function), 它描述对于不同的模型参数,出现x这个样本点的概率是多少。
属于已知具体样本数据,对于模型的参数进行分析预测

例如,f(x,y)=xy, 即x的y次方。如果x是已知确定的(例如x=2),这就是f(y)=2y, 这是指数函数。 如果y是已知确定的(例如y=2),这就是f(x)=x2,这是二次函数。同一个数学形式,从不同的变量角度观察,可以有不同的名字。

而对于极大似然估计就是找到这个theta值使似然函数最大

——参考文章:

详解最大似然估计(MLE)、最大后验概率估计(MAP),以及贝叶斯公式的理解

猜你喜欢

转载自blog.csdn.net/Innovat1on/article/details/87426368