Sentence-LDA的介绍及程序

其他 2018-06-14 12:07:23 阅读次数: 2

Sentence-LDA的相关论文：

Jo Y, Oh A H. Aspect and sentiment unification model for online review analysis[C]//Proceedings of the fourth ACM international conference on Web search and data mining. ACM, 2011: 815-824.

模型是这个样子的：
这里写图片描述

Zhang S, Sha Y, Wang X. Reviews Analysis Based on Sentence and Word Relevance[C]//Computational Intelligence and Design (ISCID), 2014 Seventh International Symposium on. IEEE, 2014, 1: 43-46.
模型是这个样子的：
这里写图片描述

Balikas G, Amini M R, Clausel M. On a Topic Model for Sentences[C]//Proceedings of the 39th International ACM SIGIR conference on Research and Development in Information Retrieval. ACM, 2016: 921-924.
模型是这个样子的：
这里写图片描述
Büschken J, Allenby G M. Sentence-based text analysis for customer reviews[J]. Marketing Science, 2016, 35(6): 953-975.
模型是这个样子的：

这几篇论文，是我看到的做Sentence-LDA，发现模型都是一样。。。。。哎，他们提出的模型，尽然都是一样的。

Sentence-LDA的思想

LDA的思想是每篇文档是由多个主题混合而成的，每个单词有其对应的主题。但针对短文本而言，每句话可能表达的仅仅是一个主题，Sentence-LDA的假设便是文档中的一个句子来自于一个主题。

这里写图片描述

其生成过程如下：

这里写图片描述

基于上面的图，我解释一下，一篇文档多多个句子，每个句子的所有词均有一个主题z生成。

Gibbs抽样推断

主题z的抽样

这里写图片描述

这里需要注意的是i表示第i个句子，可以看出这里抽的是句子的主题。而传统LDA里抽的是词的主题。这里写图片描述表示文档d的句子中，分配到主题k的数量。表示分配单词w被分配到主题k的数量。

具体该公式的推理，可以看Sentence-based text analysis for customer reviews论文的附录。

文档的主题分布计算

这里写图片描述

主题的词分布计算

这里写图片描述

代码

是由16年，On a topic model for sentences这篇文章的作者提供的，为python版本，具体地址为：https://github.com/balikasg/topicModelling/

猜你喜欢

转载自blog.csdn.net/qy20115549/article/details/77276550

Sentence-LDA的介绍及程序

PCA与LDA介绍

LDA模型介绍

sentence

Sentence A

[sentence]

LDA

LDA主题模型学习相关的书籍介绍

LDA的演变1--从算法层面来介绍LDA的由来或者说发展

sklearn之线性判别分析（LDA）类库介绍

详细介绍Sentence-BERT:使用连体BERT网络的句子嵌入

Daily Sentence

sentence pattern

Sentence Similarity

A sentence for a day

LDA模型

LDA理解

pyspark LDA

Spark LDA

【LDA】周志华

PCA与LDA

LDA的使用

LDA推导

GMM与LDA

lda代码

LDA预测

LDA闲谈

Gaussian LDA（高斯LDA）简介

lda lda2vec

One sentence per day

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

周排行

Metasploit文件目录与入侵基本概念

跨域(CORS)请求问题[No 'Access-Control-Allow-Origin' header is present on the requested resource]常见解决方案

CodeIgniter 源码解读之 CodeIgniter.php（二）

SAS入门之（四）改变数据类型

初识元组

[数学建模]数学建模算法和模型（B站视频）（二）

Nginx 服务器源码安装配置流程

C#实现语音视频录制【基于MCapture + MFile】

开发进度4

下载安装vue的方法网址

每日归档

更多

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)