文本匹配：MatchPyramid - 代码天地

文本匹配：MatchPyramid

其他 2018-08-20 10:24:04 阅读次数: 0

一、概述

MatchPyramid来自Liang Pang等在2016发表的一篇文章Text Matching as Image Recognition，大意为利用图像识别的方式进行文本匹配。

二、思路

对于文本匹配，基本思路如下述公式：
这里写图片描述
其中T为文本，函数 $θ$ 代表将文本转换为对应的表示，函数 $F$ 则代表两个文本表示之间的交互关系。
由侧重点不同可分为表示方法与交互方法，即注重 $θ$ 或者 $F$ ，而MatchPyramid应属于后一种。

1、基本方法

构建文本与文本的相似度矩阵，采用CNN对矩阵进行特征抽取，最后用softmax获得分类概率，评价方法为交叉熵，如下：
这里写图片描述

2、流程

（1）相似度矩阵

由于CNN针对的是网格型数据，而文本显然属于序列数据，那么就有必要对数据进行转换，论文中提出了三种构建相似度矩阵的方法：
这里写图片描述
0-1类型，每个序列对应的词相同为1，不同为0

cosine距离，使用预训练的Glove将词转为向量，之后计算序列对应的词的cosine距离

点积，同上，但是将cosine距离改为点积
作者在文中提到，距离矩阵使用点积的效果相对较好。

（2）两层CNN

后续利用两层的CNN对相似度矩阵进行特征抽取，这里要注意的是由于上一层的相似度矩阵shape不一致，在第一层CNN后面进行maxpool的时候，要使用动态pool，有没有其他的小trick就不可得知了。

（3）两层MLP

最后用两层的全连接对CNN的结果进行转换，使用softmax函数得到最终分类概率。

三、其他

作者使用论文中的模型，在kaggle的quora数据集中得到一个相当不错的分数，最终小组成绩达到了第四名。
附实现地址：https://github.com/faneshion/MatchZoo

猜你喜欢

转载自blog.csdn.net/sinat_33741547/article/details/80649542

文本匹配：MatchPyramid

文本匹配

Triplet/表示模型/MatchPyramid等

自动匹配文本

深度文本匹配总结

文本匹配（Text Matching）

NLP | 文本匹配算法

文本语义匹配概述

文本数据的匹配

文本表示与匹配

文本匹配算法

文本匹配技术

文本匹配算法详解

python简单文本匹配

深度文本匹配的基本方法

文本匹配：LSTM-RNN

文本匹配学习，更新中

NLP | 文本匹配算法(MaxMatch)

3.2.2.4 文本匹配锚点

文本匹配ESIM模型详解

文本匹配——【NAACL 2021】AugSBERT

文本匹配之SimCSE模型

文本相似度、文本匹配、文本聚类

[Alg] 文本匹配-多模匹配-AC自动机

[Alg] 文本匹配-多模匹配-WM算法

堆栈应用：匹配文本符号（{ }、[ ]、（））----2018.5.13

匹配标签的正则（用于抽取纯文本）

使用正则匹配并填充文本模板

基于文本模板匹配的数据清洗

深度文本匹配发展总结

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)