Bert系列：论文阅读Rethink Training of BERT Rerankers in Multi-Stage Retrieval Pipeline - 代码天地

Bert系列：论文阅读Rethink Training of BERT Rerankers in Multi-Stage Retrieval Pipeline

其他 2021-12-14 22:08:18 阅读次数: 0

一句话总结：提出Localized Contrastive Estimation (LCE)，来优化检索排序。

摘要

预训练的深度语言模型(LM)在文本检索中表现出色。基于丰富的上下文匹配信息，深度LM微调重新排序器从候选集合中找出更为关联的内容。同时，深度lm也可以用来提高搜索索引，构建更好的召回。当前的reranker方法并不能完全探索到检索结果的效果。因此，本文提出了Localized Contrastive Estimation(LCE)训练重排序模型，从效果上看，显著改进了深度两阶段模型。

方法

训练一个bert模型给query和doc对打分：

其中cls表示bert输出的文本embedding，cls位置的值，将query和doc拼接起来作为整体。Vp是一个projection vector（投影向量，这是什么意思？从何而来?）。
补充：

Vanilla method

它用binary cross entropy 单独算query和doc对的得分。
在这里插入图片描述
该法将这个问题当做了一个二分类的概率问题。文中说：However, reranker is unique in nature; it deals with the very top portion of retriever results, each of which may contain many confounding signatures. 翻译一下，就是排序本身就不是公平的事情，只关注了检索结果的头部部分，可能包含了一些“混淆信息”，就是其实跟query不相关，但是也进入了头部位置。

Localized Contrastive Estimation (LCE)

Contrastive Loss：相对损失，通俗点说，一个query和doc对，相对全部query和doc对和的大小。
举个例子：一个query：A，跟一堆doc：B、C、D，<A,B>的loss = <A,B>/(<A,B>+<A,C>+<A,D>)
在这里插入图片描述

参考：
1.作者代码：https://github.com/luyug/Reranker
2.论文：https://arxiv.org/abs/2101.08751
3.Vanilla method：

猜你喜欢

转载自blog.csdn.net/pearl8899/article/details/117792320

Bert系列：论文阅读Rethink Training of BERT Rerankers in Multi-Stage Retrieval Pipeline

BERT

【论文及代码详解】BEIT: BERT Pre-Training of Image Transformers

【论文笔记】BEIT:BERT PRE-TRAINING OF IMAGE TRANSFORMERS

BEiT: BERT Pre-Training of Image Transformers 论文笔记

论文阅读：BERT：Pre-training of Deep Bidirectional Transformers for Language Understanding

【论文阅读】BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

BERT论文解读:BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

【自然语言处理 | BERT】BERT:Pre-training of Deep Bidirectional Transformers for Language Understanding论文讲解

李沐论文精读：BERT 《BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding》

Bert系列：论文阅读Understanding the Behaviors of BERT in Ranking

Bert论文阅读

Training Vision Transformers for Image Retrieval 论文笔记

bert系列二：《BERT》论文解读

Multi-Stage Pathological Image Classification using Semantic Segmentation 论文解析

cvpr 2021图像增强论文笔记Multi-Stage Progressive Image Restoration详解

【论文笔记】图像修复MPRNet:Multi-Stage Progressive Image Restoration 含代码解析

BERT:Pre-training of Deep Bidirectional Transformers for Language Understanding

BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

对抗对齐分布--Adversarial Domain Adaptation for Cross-lingual Information Retrieval with Multilingual BERT

BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding 论文笔记

【论文笔记】BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

论文笔记：BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

论文译文——BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

【论文解读】BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding 论文研读

【论文笔记】BERT : Pre-training of Deep Bidirectional Transformers forLanguage Understanding

【NLP经典论文精读】BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

论文笔记：NLP之BERT，ERNIE(pre-training 模式在NLP任务中的使用)

Bert系列：论文阅读Learning-to-rank with bert in tf-ranking

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)