似然,似然,似是而然!

似然,似然,似是而然!

1.1 似然是蛤?

在统计学中,似然和概率可是两码事。
 概率:在已知的模型下,某事件发生的可能性。
 似然:在未知的模型下,发生了一系列的事件,有这些事件的结果去估计该未知模型的相关参数(条件)。
 举一个小例子可能会更形象。现在我有一枚标准的硬币,我将它抛在了空中,这时我想知道它落地时是正面朝上的可能性是多少?毫无疑问,因为该硬币是标准的,正面和反面朝上的概率是~~ 五五开~~(卢老爷警告)50%。而似然就是,现在我拿到的硬币可能不在是标准的,有可能正面比反面重也有可能是相反的情况,我将这个硬币抛了一千次,发现有700次是正面朝上,300次是反面朝上。那么我可以估计这枚硬币不是标准的硬币,这枚非标准的硬币的随意一抛正面朝上的概率(参数)估计为0.7(标准硬币
的参数为0.5)。
总的来说:概率就是在已知模型下,对可能发生的救国进行描述。似然就是通过已经得到的结果发生该结果的模型进行描述。

1.2 似然函数又是蛤?

  概率密度函数: P ( x θ ) P ( x|\theta )
 似然函数: L ( θ x ) L ( \theta | x )
  在x和 θ \theta 相互对应时,两个函数的数值是相等。但两个函数所表示的含义是完全不同的。似然函数是给定参数的情况下,发生已知结果x的可能性。
  同样还是硬币为例子进行说明。加入我抛了五次的硬币,产生了一个确切的结果即正正反正反,现在我们根据这个硬币的性质假设抛出为正的概率为 θ \theta (即设置了该硬币的相关参数值为 θ \theta ),那么 出现这一结果(正正反正反)的可能性就是 θ \theta θ \theta (1- θ \theta ) θ \theta (1- θ \theta ) ,这个可能性的值就是似然函数的值。

1.3似然函数到最大似然估计

  还是延续上文的硬币的例子。理论上来讲我想知道一枚未知硬币的参数,我得抛无数次,但是我时间有限,我只抛了五次就想估计一下这枚硬币的参数。根据我们得到的似然函数值即 θ 3 ( 1 θ ) 2 \theta ^ { 3 } ( 1 - \theta) ^ { 2 } ,随着 θ \theta 的取值不同,其函数值也不同。当 θ \theta =0.2时,似然函数值为0.00512,当 θ \theta =0.3时,其函数值为0.01323。显然后者的似然函数值大于前者,故如果硬币的参数是0.3与参数是0.2相比,更有可能获得我们已知的五次实验结果,故估计参数为0.3更靠谱。

 显然存在一个 θ \theta =0.6使得函数值取最大值,即当估计此硬币的参数为 θ \theta =0.6(正面朝上)时,出现正正反正反这种情形的可能性最大。所以根据这五次的实验,我们对此硬币的参数能做出的最好的估计就是0.6。当然五次实验的数据得出的估计是难以说服人的,所以当做了五万次实验得出的估计是更接近真实的参数的。
  最大似然估计就是利用你手头得到的结果数据,从而对总体的参数做一个最靠谱的估计。

1.4 最大似然估计的一般套路:

根据概率分布、统计的结果写出似然函数。对似然函数取对数(连乘变连加)。求导,一阶导数为0。解方程。做结论。

发布了53 篇原创文章 · 获赞 13 · 访问量 9163

猜你喜欢

转载自blog.csdn.net/weixin_43770577/article/details/104064438