Gaussian LDA(高斯LDA)简介

本文作者:合肥工业大学 管理学院 钱洋 email:[email protected] 内容可能有不到之处,欢迎交流。
未经本人允许禁止转载

论文来源

Das R, Zaheer M, Dyer C. Gaussian lda for topic models with word embeddings[C]//Proceedings of the 53rd Annual Meeting of the Association for Computational Linguistics and the 7th International Joint Conference on Natural Language Processing (Volume 1: Long Papers). 2015, 1: 795-804.

这篇论文发在15年的计算机顶会ACL上,作者来自于卡内基梅隆。

简介

连续的词嵌套模型学习海量的非结构化文本效果非常好,适应于很多自然语言处理任务。在作者的这篇文章中,作者将LDA中词的生成部分换成了多元高斯分布,并采用了一种快速的collapsed Gibbs sampling算法来求解模型。

普通的LDA简介我就不过多介绍了,想了解的请看我之前的相关博客介绍。其生成方式如下:

论文理解


这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述

说明

这里涉及到许多贝叶斯公式推理方面的知识,建议大家参考以下内容:
1、《LDA数学八卦》
2、Griffiths T. Gibbs sampling in the generative model of latent dirichlet allocation[J]. 2002.
3、Murphy K P. Conjugate Bayesian analysis of the Gaussian distribution[J]. def, 2007【这个相当好,提供了大量的与高斯分布先验后验的推理细节
4、Bayesian_Data_Analysis,Third_Edition_(Andrew_Gelman)【一本非常学习贝叶斯数据分析非常不错的书籍】

代码详解

猜你喜欢

转载自blog.csdn.net/qy20115549/article/details/79528781
LDA
今日推荐