Recurrent neural network language modeling toolkit 源码内部数据结构图解 - 代码天地

Recurrent neural network language modeling toolkit 源码内部数据结构图解

其他 2019-01-10 08:10:56 阅读次数: 0

最后一篇将前面分散在各篇的图全部在这儿汇总一下吧，也供自己以后再回头看看。学习的时候尽量一步一个脚印，每走一步都要让自己尽可能的踏实，这样自己的知识才会非常牢固。并且在写东西的时候能使思维慢下来，慢下来的过程中，常常会发现自己头脑里一晃而过的事儿，认为自己弄明白了，但仔细到细节并要能写出来却发现什么也不清楚，然后就会发现自己很多东西根本就没落实。或许把一些东西写下来非常慢，但很多时候我都发现，慢慢来，反而比较快。好了，下面是正文，就结束rnnlm toolkit源码阅读了。

1.首先是论文中最“常规”RNN结构，如下，关于rnn原理推导，请移步这儿。

2.为了加快计算速度，将输出层分解后的RNN，在我前面的某一篇中介绍过了，但个人感觉不是很细，可以看看参考我列出的第5篇文献

3.反向学习算法中，bptt算法将rnn展开后的图，这里的BPTT算法推导，见这儿。

4.源码中会经常查询一个词，然而当|V|比较大时，这项反复用到的操作就会使速度降低，为了使查找某个单词更快，比如达到O(1)，所以构造了三层的查询结构，内部数据结构图如下，对应的源码在另一篇文章中查看searchVocab函数

5.整个rnnlm toolkit源码中的纯rnn部分（即不含ME部分）抽象出来的图如下：

6.在学习算法中，BPTT的描述用的全部是一维数组，图如下：

7.输出层的分解是基于单词分类的，这个分类后的结果可以用如下的数据结构图来描述，分类的算法移步到这儿，见里面带有注释//old classes的部分。

8.这一部分是单独说明神经网络版本的最大熵模型的图解，具体详细的可以参考我列出来的第9篇参考文献。

9.下面部分就是RNN中的最大熵模型的数据结构描述了，仍然是用的一些相互关联的一维数组，这里的基于哈希实现我感觉十分精妙！很大程度上降低了计算量。

10.最后是RNN+ME的结构图，因为用的是一维数组表示，所以图就会复杂一些，内部的逻辑关联也会复杂一些。

11.最后是训练数据和测试数据用到的PPL计算公式如下，代码里面的c = 10

12.最后把参考文献汇总在这儿（尽管前面每篇开头都有-_-），算是为了完整性啰嗦一把。

RNNLM - Recurrent Neural Network Language Modeling Toolkit(点此阅读)
Recurrent neural network based language model(点此阅读)
EXTENSIONS OF RECURRENT NEURAL NETWORK LANGUAGE MODEL(点此阅读)
Strategies for Training Large Scale Neural Network Language Models(点此阅读)
STATISTICAL LANGUAGE MODELS BASED ON NEURAL NETWORKS(点此阅读)
A guide to recurrent neural networks and backpropagation(点此阅读)
A Neural Probabilistic Language Model(点此阅读)
Learning Long-Term Dependencies with Gradient Descent is Difficult(点此阅读)
Can Artificial Neural Networks Learn Language Models?(点此阅读)

这下全文完，后期继续LM的学习，希望能在找工作前把这些给整理好，加油吧。

猜你喜欢

转载自blog.csdn.net/a635661820/article/details/44808727

Recurrent neural network language modeling toolkit 源码内部数据结构图解

【NLP】Recurrent Neural Network and Language Models

Recurrent Neural Network

Independently Recurrent Neural Network

Training Recurrent Neural Network

《ABCNN: Attention-Based Convolutional Neural Network for Modeling Sentence Pairs》《Convolutional Neural Network Architectures for Matching Natural Language Sentences》

Recurrent Neural Network Based Language Model(RNNLM)原理及BPTT数学推导

Neural Network Language Model

Recurrent Neural Network(1):Architecture

A RECURRENT NEURAL NETWORK WITHOUT CHAOS

Lecture 6: Language Models and Recurrent Neural Networks

Recurrent Neural Network（递归神经网络）

神经网络（Recurrent Neural Network，RNN）

Recurrent neural network (RNN) - Pytorch版

循环神经网络（Recurrent Neural Network）

Implementing Recurrent Neural Network from Scratch

Recurrent Neural Network(递归神经网络）

详细介绍Deeper Text Understanding for IR with Contextual Neural Language Modeling

Language Modeling

A Language-Independent Neural Network for Event Detection

论文《Chinese Poetry Generation with Recurrent Neural Network》阅读笔记

Building a Recurrent Neural Network Step by Step--[0]

RNN（Recurrent Neural Network）循环神经网络

循环神经网络：RNN（Recurrent Neural Network）

循环神经网络（Recurrent Neural Network，RNN）

tensoflow练习2：利用Recurrent Neural Network 进行分类

AI（008） - 循环神经网络（Recurrent Neural Network）

【Recurrent Neural Network Regularization】读后感（未编辑完毕）

Quasi Recurrent Neural Network （qrnn）（git待更新...）

循环神经网络（Recurrent Neural Network, RNN）

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)