Convolutional Neural Networks for Sentence Classification(卷积神经网络用于句子分类)

其他 2019-04-29 16:54:35 阅读次数: 0

本篇博文仅仅用于自己学习的笔记，若有错误欢迎指正。

参考:

论文:Convolutional Neural Networks for Sentence Classification

代码:https://github.com/dennybritz/cnn-text-classification-tf

Model(模型)：

模型结构图：

模型思路：

令 $x_i∈R^k$ 表示一个句子的第i个词的词向量；句子长度用n表示，对于长度不是n的进行相应的填充与截断； $x_{i:n}=x_1⊕x_2⊕….⊕x_n$ 表示一个句子⊕是串联操作， $x_{i:i+j}$ 就是 ${x_i,x_{i+1},…,x_{i+j}}$ ;
卷积操作的过滤器用 $w∈R^{hk}$ ,它被应用到一个大小为h个词的窗口上产生一个特征 $c_i$ ，例如： $c_i=f(w*x_{i:i+h-1)+b}$ 其中f是是一个非线性函数，过滤器作用到每个可能的窗口上 $(x_{1:h},x_{2:h+1},…,x_{n-h+1:n})$ 产生特征序列 $c=(c_1,c_2,…,c_{n-h+1})$ 再应用最大池化成到这个序列上： $\hat{c} =max⁡(c)$ 它对应于每个特定过滤器，最大池化层也使得模型可以处理变长的句子。
模型使用多个不同大小的过滤器来获取多个特征。这些特征组成了倒数第二层，并被传给了最后的全连接的softmax层。

模型的一个变种：

模型的输入是静态不训练的二维句子向量([n,k])和可以被训练的二维句子向量([n,k])叠加形成的三维句子矩阵([n,k,2]).
每个过滤器都作用到不可训练的[n,k]和可训练的[n,k]两个矩阵上，再将他们加起来产生了 $c_i$ 即：
$c_{i静}=f(w*x(静)_{i:i+h-1}+b)$ $c_{i动}=f(w*x(动)_{i:i+h-1}+b)$ $c_{i}=c_{i静}+c_{i动}$

正则化：

在倒数第二层应用dropout:
- 我们从最后的全连接层的公式不再是： $y=w*z+b$ ；而是 $y=w*(z◦r)+b$ 。其中 $z=[\hat{c_1 } ,\hat{c_2 },…,\hat{c_m }]$ 是倒数第二层的输出即最大池化层的输出，卷积层有m个不同过滤器。 $◦$ 是逐点相乘运算，r是一个伯努利随机变量的masking向量并且p=1。在反向传播种梯度仅能通过没有被maked单元
- 在测试时,我们将权重放缩p倍，即： $\hat{w}=p*w$ ,我们使用这个权重并且不进行dropout来对没有见过的句子进行分类。
我们对权重向量进行L2正则
- 我们为权重向量w添加一个约束 $|(|w|)|_2≤s$ ，在梯度下降步骤之后,每当 $|(|w|)|_2>s$ ,重新调整w使其满足上面约束条件。

猜你喜欢

转载自blog.csdn.net/ACM_hades/article/details/87445095

Convolutional Neural Networks for Sentence Classification(卷积神经网络用于句子分类)

论文阅读：Convolutional Neural Networks for Sentence Classification 卷积神经网络的句子分类

Convolutional Neural Networks for Sentence Classification

《Convolutional Neural Networks for Sentence Classification》速读

理解Convolutional Neural Networks for Sentence Classification

Convolutional Neural Networks for Sentence Classification 阅读笔记

A Sensitivity Analysis of Convolutional Neural Networks for Sentence Classification

『论文阅读』：Convolutional Neural Networks for Sentence Classification

【Paper】TextCNN：Convolutional Neural Networks for Sentence Classification

《Convolutional Neural Networks for Sentence Classification》论文结构解读

KIM2014_Convolutional Neural Networks for Sentence Classification

《Convolutional Neural Networks for Sentence Classification》论文学习笔记

【Deep Learning】A Sensitivity Analysis of Convolutional Neural Networks for Sentence Classification

TextCNN Convolutional Neural Networks for Sentence Classification阅读笔记

【论文笔记】：Convolutional Neural Networks for Sentence Classification用CNN做句子分类

CNN在文本分类的应用(内有代码实现) 论文Convolutional Neural Networks for Sentence Classification

中文短文本分类实例三-TextCNN（Convolutional Neural Networks for Sentence Classification）

神经网络一 | ImageNet Classification with Deep Convolutional Neural Networks

卷积神经网络, Convolutional Neural Networks , CNN

卷积神经网络：Convolutional Neural Networks(CNN)

论文笔记：Convolutional Neural Network for Sentence Classification

论文Convolutional Naural Networks for Sentence Classification--原理与实现

ImageNet Classification with Deep Convolutional Neural Networks

ImageNet Classification with Deep Convolutional Neural Networks 译文

AlexNet《ImageNet Classification with Deep Convolutional Neural Networks》

Bag of Tricks for Image Classification with Convolutional Neural Networks

ImageNet Classification with Deep Convolutional Neural Networks(AlexNet)

AlexNet——ImageNet Classification with Deep Convolutional Neural Networks

读ImageNet Classification with Deep Convolutional Neural Networks

AlexNet：ImageNet Classification with Deep Convolutional Neural Networks

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

[编程题]学英语

[codeforces 1288A] Deadline 约数+模

Python的web开发

Docker在Centos 7上的部署

python编码

解决Ubuntu16.04 fatal error: json/json.h: No such file or directory

mysql并发插入

rest接口如何适应jsonp的方案

linux 终端上网设置

高数——等号两边同时求导、积分的解释

每日归档

更多

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)