LocalLDAModel源码中的getTopicDistributionMethod - 代码天地

LocalLDAModel源码中的getTopicDistributionMethod

其他 2018-07-16 12:20:10 阅读次数: 0

LocalLDAModel源码中的getTopicDistributionMethod 方法是这样的

private[spark] def getTopicDistributionMethod(sc: SparkContext): Vector => Vector = {
val expElogbeta = exp(LDAUtils.dirichletExpectation(topicsMatrix.toBreeze.toDenseMatrix.t).t)
val expElogbetaBc = sc.broadcast(expElogbeta)
val docConcentrationBrz = this.docConcentration.toBreeze
val gammaShape = this.gammaShape
val k = this.k

(termCounts: Vector) =>
if (termCounts.numNonzeros == 0) {
Vectors.zeros(k)
} else {
val (gamma, _) = OnlineLDAOptimizer.variationalTopicInference(
termCounts,
expElogbetaBc.value,
docConcentrationBrz,
gammaShape,
k)
Vectors.dense(normalize(gamma, 1.0).toArray)
}
}

这个broadcast 根本没有必要，完全是照搬了def topicDistributions(documents: RDD[(Long, Vector)])，其实就是把参数从RDD换成一个Vector。

而且这个broadcast 最好要destory。所以参数sc 是没有必要的。

看了issue mail，2017年的3月份改了。

SPARK的官方代码都有这样的问题，说明代码走读还是有必要的。

猜你喜欢

转载自blog.csdn.net/hhtop112408/article/details/79148476

LocalLDAModel源码中的getTopicDistributionMethod

Hibernate中HibernateDaoSupport 的源码

Robotium中源码网址

ffmepg源码中的 -re

.NET源码中的链表

MySQL源码中的String

python中查看源码

源码中transient的用途

EventBus源码研读(中)

解读源码中的问题

java源码中的注解

drf中listreializer源码

linux中的源码安装

JavaClassLoader源码分析（中）

java中equals源码

android系统源码中添加app源码（源码部署移植）

Iterator在ArrayList中的源码实现

Mybatis中selectKey源码分析

源码安装中./configure的使用

LinkedBlockingQueue中put源码分析

eclipse 中绑定 android源码

从GitHub中获取Spring源码

eclipse中建geoserver源码

android源码中混淆编译

Android中的ThreadLocal源码解析

String源码中hashCode算法

RHEL中Nginx源码安装

ibatis中selectKey的用法与源码

在Eclipse中查看Android源码

Netty中的Future源码解读

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)