自然语言处理(三 RNNLM优化)

其他 2018-10-27 04:53:54 阅读次数: 0

RNN LM性能改进

RNN LM性能改进

主要改进trick：输入数据预处理，改进模型结构，改变输入数据格式，正则化

数据预处理

（1）随机选取句子中的部分词语进行表示（使用drop rate选取句子中的词语）；
（2）bigram 内插、平滑等

模型结构改进

（1）SRNN->LSTM->GRU->minimal RNN
（2）LSTM前添加CNN，选取不同长度的filter函数能够抓取一些短语信息；
（3）NCE机制，能够加快Softmax层计算
（4）快速LM训练：HS, Negative Sampling,NCE
（5）若是训练word2vec，可以推荐facebook的fasttext工具。

改变模型输入数据

word level LM -> subword level LM -> character level LM

正则化

避免模型过拟合，可以采用drop out等正则化方法

猜你喜欢

转载自blog.csdn.net/u011195431/article/details/78689971

自然语言处理(三 RNNLM优化)

利用TextBlob优化自然语言处理

「自然语言处理（NLP）」入门系列（三）单词表示、损失优化、文本标记化？

rnnlm源码分析(三)

自然语言处理（三）

自然语言处理-命名实体识别的预料优化

自然语言处理(三)语言模型

自然语言处理NLP（三）

自然语言处理学习笔记（三）

自然语言处理（三）】主题模型

NLP自然语言处理（三）

「自然语言处理(NLP)」卡内基梅隆（基于语言知识的循环神经网络（RNN优化））

自然语言处理

自然语言处理①

「自然语言处理（NLP）论文解读」中文命名实体识别（Lattice-LSTM模型优化）

【自然语言处理介绍】

自然语言处理-------jieba

自然语言处理概览

Python自然语言处理

自然语言处理 Word

自然语言处理（NPL）

【自然语言处理】LDA

自然语言处理语料

自然语言处理班

对“自然语言处理”的理解

Python 自然语言处理

自然语言处理——资源

自然语言处理专题

自然语言处理-1

自然语言处理综述

今日推荐

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

周排行

Family Tree 题解

BZOJ 1093 最大半连通子图 SCC + DP

幂等处理

Spring----学习（2）----XML 配置Bean 自动装配

SQL Server 远程更新目标表数据

HIbernate3.6 环境搭建

特殊符号正则表达式

【Linux】第一章进程的理解

843. n-皇后问题（dfs+输出各种情况）

空间数据库2

每日归档

更多

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)