如何训练Embedding Model - 代码天地

如何训练Embedding Model

企业开发 2023-12-27 17:17:27 阅读次数: 0

BGE的技术亮点：

高效预训练和大规模文本微调；
在两个大规模语料集上采用了RetroMAE预训练算法，进一步增强了模型的语义表征能力；
通过负采样和难负样例挖掘，增强了语义向量的判别力；
借鉴Instruction Tuning的策略，增强了在多任务场景下的通用能力。

数据集的构成：
在这里插入图片描述

RetroMAE预训练

主要思想是：encoder用小一点的mask rate得到sentence embedding，然后decoder用大一点的mask rate结合encoder得到的sentence embedding进行重构

在这里插入图片描述
此外，为了使得每个token使用的context信息不同，RetroMAE还使用了增强解码的方法

在这里插入图片描述

解码的时候每一行都带，上下文信息和位置信息

微调

主要通过对比学习和Instruction Tuning的思想

对比学习是一种训练模型的方法，通过比较正例和反例来学习数据的表示。

输入数据的格式：模型接受三元组格式的数据作为输入，包括一个查询（query），一个正例（positive），和一个反例（negative）。
in-batch negatives 策略：除了上述三元组中的反例外，他们还采用了“in-batch negatives”策略，意思是在同一个批次的数据中，使用其他数据作为额外的反例。
cross-device negatives sharing method：这是一种在不同的GPU之间共享反例的方法，目的是大大增加反例的数量。
训练硬件和参数：使用了48个A100(40G)的GPU进行训练。批次大小为32,768，因此每个查询在批次中有65,535个反例。使用了AdamW优化器，学习率为1e-5。对比损失的温度为0.01。
在训练中为检索任务的查询添加了instruction。对于英语，指令是Represent this sentence for searching relevant passages: ; 对于中文，指令是为这个句子生成表示以用于检索相关文章：. 在评测中，针对段落检索任务的任务需要在查询中添加指令，但不需要为段落文档添加指令。

猜你喜欢

转载自blog.csdn.net/RandyHan/article/details/134058062

如何训练Embedding Model

如何重构tensorflow model

pytorch 修改预训练model

Keras: model中如何固定部分layer，训练部分layer

将tensorflow训练的model,转换为.pb格式的model

model

redirect如何让url忽略model

如何看懂代码-从Model开始

Black Box Adversarial Attack With Transferable Model Based Embedding

Inf2vec: Latent Representation Model for Social Influence Embedding

MNLM：Word Embedding开山之作 A Neural Probabilistic Language Model

如何保存和加载XGBoost模型（save model and load model）

mxnet model_zoo.get_model, 如何使用本地的parameter?

model训练结束后绘制loss曲线

caffe Python API 之Model训练

使用TensorFlow训练Boosted Trees model

Tensorflow如何保存、读取model （即利用训练好的模型测试新数据的准确度）

如何导入训练好的tensorflow model 并用其来预测自己的数据？

如何正确使用 Django的User Model

Thymeleaf-如何获取model中的值

Qt之如何自定义model

WPF：如何高速更新Model中的属性

Android Studio如何完整的删除model

android项目中如何导入model

如何在自己的model中，加入签名。

pytorch中如何使用预训练好的BERT当作embedding

Pytorch 训练和测试时记得加 model.train 和 model.eval

模型训练时使用的 model.train() 和模型测试时使用的 model.eval()

聊聊 Vue 的双向数据绑定，Model 如何改变 View，View 又是如何改变 Model 的

Vue 的双向数据绑定，Model如何改变View，View是如何改变Model的？

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)