论文阅读 | A Deep Relevance Matching Model for Ad-hoc Retrieval - 代码天地

论文阅读 | A Deep Relevance Matching Model for Ad-hoc Retrieval

其他 2018-10-19 19:18:39 阅读次数: 0

A Deep Relevance Matching Model for Ad-hoc Retrieval

（2016 CIKM）

模型细节

Alt text

1.对于query中的每个词建立mapping直方图

输入：query中的每个词和doc所有词产生term pair，对于每一个pair使用相似度计算（论文中使用了cos距离），考虑到位置对于匹配问题其实没有影响，此处不用位置信息，而是将每个pair的相似度进行分级（即文中说的直方图）
- 例如：将余弦相似度[-1, 1]分为五个区间{[-1,-0.5), [-0.5,-0), [0,0.5), [0.5,1), [1,1]} 。给定query中的一个词“car”以及一篇文档（car, rent, truck, bump, injunction, runway）, 得到对应的局部交互空间为(1, 0.2, 0.7, 0.3, -0.1, 0.1)，最后我们用基于计数的直方图方法得到的直方图为[0,1, 3, 1, 1]。
对于直方图的生成有三种形式：
直方图相对于matching matrix的优点：
1.通过直方图，区别不同的匹配信号，而不像matching matrix所有匹配信号都混杂在一起
2.不需要zero padding，在matching matrix 中对于短文本需要进行padding，从而对其造成影响

2.输入到前馈神经网络

对于query的每个词形成的直方图输入到前馈神经网络
Alt text
$z_i^0$ 表示了对每个query生成直方图的过程
$z_i^l$ 表示输入前馈神经网络的过程

3.产生最后的匹配分数

对于每个query词产生的 $z_i$ ，最后通过一个gating network $g_i$ 生成最后的分数，类似于注意力机制
Alt text
其中，

此处有两种方式：
（1）TV: $x_i$ 为query embedding， $w_g$ 为与embeding同等维度的weight vector
（2）IDF: $x_i$ 为query的idf， $w_g$ 为一个标量需要学习

结果分析

Alt text
（1）加入idf非常有用
（2）NH方法效果很差，可能因为失去了doc长度，而doc长度在匹配问题中其实很有用

猜你喜欢

转载自blog.csdn.net/qq_41058526/article/details/81437525

论文阅读 | A Deep Relevance Matching Model for Ad-hoc Retrieval

论文阅读：《A Deep Relevance Model for Zero-Shot Document Filtering》

SIGIR 2016 Improving Language Estimation with the Paragraph Vector Model for Ad-hoc Retrieval

论文阅读 | Bridging the Gap Between Relevance Matching and Semantic Matching for Short Text Similarity Modeling

《Deep Learning of Graph Matching》论文阅读

论文阅读：Deep Image Retrieval: Learning global representations for image search

【论文阅读】A Deep Look into Neural Ranking Models for Information Retrieval

论文：《Deep Supervised Hashing for Fast Image Retrieval》

关于ad hoc retrieval的解释

跨模态检索论文阅读：Dissecting Deep Metric Learning Losses for Image-Text Retrieval(GOAL)

【论文阅读笔记】---《A Survey of Model Compression and Acceleration for Deep Neural Networks》

Deep Learning of Graph Matching 阅读笔记

读论文，衣物检索：Clothing Retrieval with Visual Attention Model（2017.10.31）

【论文理解】Clothing Retrieval with Visual Attention Model

Ansible ad-hoc

Ad-hoc

阅读笔记Where to Focus: Query Adaptive Matching for Instance Retrieval Using Convolutional Feature Maps

强化学习《A DEEP REINFORCED MODEL FOR ABSTRACTIVE SUMMARIZATION》论文阅读笔记

论文阅读笔记之Replacing Mobile Camera ISP with a Single Deep Learning Model

#Reading Paper# 【序列推荐】SDM: Sequential Deep Matching Model for Online Large-scale Recommender System

【论文阅读】 Sequential Matching Network

文献阅读——《Deep Learning for Content-Based Image Retrieval:A Comprehensive Study》

Evaluation of Deep Convolutional Nets for Document Image Classification and Retrieval 论文笔记

论文笔记：Effective and Efficient Sports Play Retrieval with Deep Representation Learning

IOS - Ad-Hoc Distribution

Ansible Ad-Hoc命令

ansible之Ad-Hoc

HHL论文及代码理解（Generalizing A Person Retrieval Model Hetero- and Homogeneously ECCV 2018）

【阅读笔记】Ranking Relevance in Yahoo Search

Bridging the Gap Between Relevance Matching and Semantic Matching for Short Text Similarity Modeling

今日推荐

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

最强开源大模型 Llama 3 上架 Gitee AI

周排行

自媒体文章如何提高原创度以及如何检测原创度

开启qq邮箱的smtp服务

Qt程序单次启动（QSingleApplication类）

国外的外包网站

更新IDEA主题——放飞代码风格

cocos2dx 实现搓牌效果（翻牌效果），包括铺平动画

dict和json之间的互相转换

angular的一些思考

. Fibonacci数列是这样定义的： F[0] = 0 F[1] = 1 for each i ≥ 2: F[i] = F[i-1] + F[i-2] 因此，Fibonacci数列就形如：0, 1

洛谷P1064 金明的预算方案

每日归档

更多

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)

2024-04-16(70)