【论文复现】Character-level Convolutional Networks for Text Classification - 代码天地

【论文复现】Character-level Convolutional Networks for Text Classification

其他 2019-02-25 01:36:18 阅读次数: 0

写在前面

今天讨论的论文依然是文本分类主题的。Character-level Convolutional Networks for Text Classification这篇论文是在2016年4月份发表的，在此之前，深度学习自然语言处理问题的处理思路基本都是基于单词或者短语（n-grams）。这篇文章作者受到 ImagineNet卷积神经网络处理图片从底层像素开始的思路影响，开始试图从字符角度出发重新训练神经网络。在此之前，作者团队在2015年也发表了相类似的文章（相似度85%）Text Understanding from Scratch。因此，神经网络不再需要提前输入关于单词的信息，并且这些单词的知识往往是高维的，很难应用于CNN中。除此之外，神经网络也不在需要提前知道关于语法和语义的只是。作者称这种基于字符的学习为从零开始学习（learn from scratch）。并且作者提到，这种学习策略很容易推广到所有语言。

模型框架

论文的实现框架就是由一个个模块堆砌成的，如下图所示：

1. Character quantization

这里的Character quantization就是将输入的每个字符用ont-hot编码表示出来。这里作者提出模型中使用的字母表一共包括70个字符，其中26个英文字母，10个数字，33个其他字符和一个全零向量（用于表示unknow字符）。另外处理输入的时候，作者选择反向处理字符编码，即反向读取文本，这样做的好处是最新读入的字符总是在输出最开始的地方。

abcdefghijklmnopqrstuvwxyz0123456789
-,;.!?:’’’/\|_@#$%ˆ&*˜‘+-=<>()[]{}

2. Conv. and Pool. layers

论文中设计了两种神经网络，一个大的一个小的。他们都有6个卷积层和3个全连接层总共9层，区别是卷基层通道的个数frame和全连接层神经元的个数。论文中给出了大小两种模型详细的卷积层和全连接层的配置参数，卷积和池化的方式都采用“VALID”，即不进行补零操作。另外在全连接层中间还有两个dropout层，dropout的概率为0.5，以防止出现过拟合。权重初始化的方式为高斯分布，大模型的均值方差为（0,0.02），小模型的均值方差为（0,0.05）。

模型复现

https://github.com/KaiyuanGao/text_claasification/tree/master/char_cnn_classification

猜你喜欢

转载自blog.csdn.net/Kaiyuan_sjtu/article/details/85220516

【论文复现】Character-level Convolutional Networks for Text Classification

Character-level Convolutional Networks for Text Classification

翻译Character-level Convolutional Networks for Text Classification

《Character-level convolutional networks for text classification》论文网络结构解读

《Character-level Convolutional NNetworks for Text Classification》论文学习

读 Character-level Convolutional Networks for Text Classiﬁcation

Very Deep Convolutional Networks for Text Classification

『论文阅读』：Convolutional Neural Networks for Sentence Classification

(35) [arXiv17] Very Deep Convolutional Networks for Text Classification

Graph Convolutional Networks for Text Classification原码解读[pytorch]

Graph Convolutional Networks for Text Classification原码解读[tensorflow]

中文短文本分类实例四-charCNN-zhang（Character-level Convolutional Networks for Text Classiﬁcation）

Convolutional Neural Networks for Sentence Classification

AlexNet论文(ImageNet Classification with Deep Convolutional Neural Networks)(译)

【论文阅读】DeepPap: Deep Convolutional Networks for Cervical Cell Classification

【论文】AlexNet-ImageNet Classification with Deep Convolutional Neural Networks

论文Convolutional Naural Networks for Sentence Classification--原理与实现

论文笔记《ImageNet Classification with Deep Convolutional Neural Networks》

《Convolutional Neural Networks for Sentence Classification》论文结构解读

【论文阅读】Bag of Tricks for Image Classification with Convolutional Neural Networks

Deep Convolutional Neural Networks for Image Classification: A Comprehensive Review(论文解读)

AlexNet论文翻译-ImageNet Classification with Deep Convolutional Neural Networks

《Convolutional Neural Networks for Sentence Classification》论文学习笔记

ImageNet Classification with Deep Convolutional Neural Networks论文解读（AlexNet详解）

论文解读《ImageNet Classification with Deep Convolutional Neural Networks》

《SEMI-SUPERVISED CLASSIFICATION WITH GRAPH CONVOLUTIONAL NETWORKS》论文阅读

《SEMI-SUPERVISED CLASSIFICATION WITH GRAPH CONVOLUTIONAL NETWORKS》论文阅读（二）

论文学习：（AlexNet）ImageNet Classification with Deep Convolutional Neural Networks

论文阅读：SEMI-SUPERVISED CLASSIFICATION WITH GRAPH CONVOLUTIONAL NETWORKS

ImageNet Classification with Deep Convolutional Neural Networks

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)