深度学习和文本分类 - 代码天地

深度学习和文本分类

其他 2018-07-30 03:31:47 阅读次数: 0

传统的文本分类模型

这里写图片描述

深度学习文本分类模型

fasttext

fastText 模型输入一个词的序列（一段文本或者一句话)，输出这个词序列属于不同类别的概率。
序列中的词和词组组成特征向量，特征向量通过线性变换映射到中间层，中间层再映射到标签。
fastText 在预测标签时使用了非线性激活函数，但在中间层不使用非线性激活函数。
fastText 模型架构和 Word2Vec 中的 CBOW 模型很类似。不同之处在于，fastText 预测标签，而 CBOW 模型预测中间词。

这个模型本身是没有什么特别之处的，它就是利用词向量的平均来做分类。

这里写图片描述

fastext本质上是一个分类模型，当然它也是可以产生词向量。不过多赘述。

textcnn

TextCNN详细过程：第一层是图中最左边的7乘5的句子矩阵，每行是词向量，维度=5，这个可以类比为图像中的原始像素点了。然后经过有 filter_size=(2,3,4) 的一维卷积层，每个filter_size 有两个输出 channel。第三层是一个1-max pooling层，这样不同长度句子经过pooling层之后都能变成定长的表示了，最后接一层全连接的 softmax 层，输出每个类别的概率。

特征：这里的特征就是词向量，有静态（static）和非静态（non-static）方式。static方式采用比如word2vec预训练的词向量，训练过程不更新词向量，实质上属于迁移学习了，特别是数据量比较小的情况下，采用静态的词向量往往效果不错。non-static则是在训练过程中更新词向量。推荐的方式是 non-static 中的 fine-tunning方式，它是以预训练（pre-train）的word2vec向量初始化词向量，训练过程中调整词向量，能加速收敛，当然如果有充足的训练数据和资源，直接随机初始化词向量效果也是可以的。

textrnn

这里写图片描述

利用最后一个词的结果直接softmax，其实这里最后一个词已经包括了前面这些词的语义信息了。

TextRnn+attention

这里写图片描述

textrcnn

这里写图片描述

猜你喜欢

转载自blog.csdn.net/ding_xiaofei/article/details/81132555

深度学习和文本分类

NLPIR深度机器学习的文本分类

深度学习与文本分类总结

基于深度学习的文本分类综述

自己动手实现深度学习框架-8 RNN文本分类和文本生成模型

基于强化学习的关系抽取和文本分类

传统文本分类和基于深度学习文本分类

fastText原理和文本分类实战

图解RNN和文本分类

意图识别和文本分类（六）

用深度学习解决大规模文本分类问题

深度学习----NLP-TextCNN文本分类解读

基于深度学习和经典方法的文本分类

动手学深度学习之文本分类

深度学习实战1----TextCNN文本分类

Task6 基于深度学习的文本分类3

Task5 基于深度学习的文本分类2

Task4 基于深度学习的文本分类1

Keras深度学习实战——新闻文本分类

【深度学习前沿应用】文本分类Fine-Tunning

使用深度学习进行中文文本分类

深度学习-nlp系列（2）文本分类（Bert）pytorch

深度学习-nlp系列（1）文本分类（TextCNN）pytorch

R语言深度学习实战：文本分类与情感分析

LIBSVM学习——文本分类

天池NLP赛事-新闻文本分类（六）——基于深度学习的文本分类3-BERT

天池NLP赛事-新闻文本分类（五）——基于深度学习的文本分类2-TextCNN、TextRNN

天池NLP赛事-新闻文本分类（四）——基于深度学习的文本分类1-FastText

文本处理（八）——深度学习在文本分类中的应用

干货解析｜深度学习文本分类在支付宝投诉文本模型上的应用

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)