简单理解极大似然估计(MLE)
基本思想
使数据集中数据出现的概率(似然)最大
举例描述
假设某一个新闻文档数据集下有体育、财经、游戏等分类,已知体育类下的所有文档中“篮球“一词出现了100次(可以统计得出,此处为了方便表示取成100),体育类下所有文档的总的词汇有10000个(可以统计得出)。我们想要估计在体育类下“篮球“一词出现的概率P(t=”篮球” | c = “体育“) 。
为了方便描述首先我们将概率P(t=”篮球” | c = “体育“) 记为
要让上述概率最大,我们只需要对
总结一下,极大似然就是对于某个事件的概率p,p使得观测数据集中对应该事件取值为最大。即使给定数据集中某个事件出现的概率最大。