ESIM - 代码天地

ESIM

其他 2019-10-03 19:27:56 阅读次数: 0

短文本匹配&自然语言推理模型--ESIM

论文链接：http://tongtianta.site/paper/11096

一、原理

ESIM，简称 “Enhanced LSTM for Natural Language Inference“。顾名思义，一种专为自然语言推断而生的加强版 LSTM。至于它是如何加强 LSTM，听我细细道来。

Unlike the previous top models that use very complicated network
architectures, we first demonstrate that carefully designing sequential inference
models based on chain LSTMs can outperform all previous models.
Based on this, we further show that by explicitly considering recursive
architectures in both local inference modeling and inference composition,
we achieve additional improvement.

上面一段话摘选自ESIM论文的摘要，总结来说，ESIM 能比其他短文本分类算法牛逼主要在于两点：

精细的设计序列式的推断结构。
考虑局部推断和全局推断。

作者主要是用句子间的注意力机制(intra-sentence attention)，来实现局部的推断，进一步实现全局的推断

1 模型输入编码层

没啥可说的，就是输入两句话分别接 embeding + BiLSTM

2 local inference modeling（局部推理建模）

local inference 之前需要将两句话进行 alignment，这里是使用 soft_align_attention。

怎么做呢，首先计算两个句子 word 之间的相似度，得到2维的相似度矩阵，

然后才进行两句话的 local inference。用之前得到的相似度矩阵，结合 a，b 两句话，互相生成彼此相似性加权后的句子，维度保持不变。

在 local inference 之后，进行 Enhancement of local inference information。这里的 enhancement 就是计算 a 和 align 之后的 a 的差和点积，体现了一种差异性吧，更利用后面的学习.

3 inference composition

最后一步了，比较简单。

再一次用 BiLSTM 提前上下文信息，同时使用 MaxPooling 和 AvgPooling 进行池化操作, 最后接一个全连接层。这里倒是比较传统。没啥可说的。

猜你喜欢

转载自www.cnblogs.com/rise0111/p/11620363.html

ESIM

eSIM 简介

eSIM技术

esim https psk

文本匹配ESIM模型详解

SIM USIM ESIM UICC科普

关于eSIM的一些简单介绍

eSIM产业动态2018年6月

eSIM终端的生产流程的思考

【实验】——ESIM: an Open Event Camera Simulator

简述eSIM对物联网的发展价值

语义相似度匹配（二）—— ESIM模型

eSIM卡要成物联网“网红”？

三大运营商eSIM商用情况

ESIM:一种开源的event 相机模拟器

场景决定技术价值，eSIM物联网应用价值分享

eSIM技术在无人值守场景下的应用，稳定、简单、高效

物联网发展下的eSIM卡特点和应用优势

面向产业互联网eSIM终端的激活方案研究

文本相似度量的非常好的ESIM算法

解读SIM卡、USIM卡、UICC卡、eSIM卡的区别

eSIM终于来临，它将如何助力IoT的发展？

Android eSIM-LPA基于Android13的实现

esim卡开通城市汇总，哪些城市可以办理？

eSIM全网切换不可思议？基于现有eSIM技术已实现全网切换

简述eSIM对物联网的发展价值----eSIM的推动将会有助于加速物联网革命。

金雅拓宣布与Qualcomm Technologies合作，将eSIM创新融入骁龙移动PC平台

IDEMIA和10T Tech宣布进行eSIM技术合作

三星新款Galaxy Watch采用捷德移动安全eSIM技术实现无缝连接

中国移动开启eSIM服务，一号双终端免费体验！

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)