通过将文档转换为问题/答案对来改进矢量搜索(教程含源码) - 代码天地

通过将文档转换为问题/答案对来改进矢量搜索(教程含源码)

业界资讯 2023-08-08 20:29:55 阅读次数: 0

我们从使用矢量数据库构建的开发人员那里听说，使用 GPT 将文档转换为不同的格式可以提高构建RAG 应用程序时矢量搜索的可靠性。

例如，将文档转换为问题和答案对，并对从这些对生成的基于向量的文档进行索引，直观上看起来对于格式化为问题的查询会产生更好的结果。

{
  "questions_and_answers": [
    {
      "question": "Who is the email from?",
      "answer": "The email is from [email protected]."
    },
    {
      "question": "Who is the email to?",
      "answer": "The email is to [email protected]."
    },
    {
      "question": "What is the issue the back office is having?",
      "answer": "The back office is having a hard time dealing with the $11 million dollars that is to be recognized as transport expense by the west desk then recouped from the Office of the Chairman."
    },
    ...
}

我们很好奇这在实践和理论上是否属实，因此我们使用 LangChain 和 FAISS 创建了一个基本基准，以确定这些性能改进是否真实以及在什么条件下真实存在。


# 结果总结
与向量化原始电子邮件相比

猜你喜欢

转载自blog.csdn.net/iCloudEnd/article/details/132124057

通过将文档转换为问题/答案对来改进矢量搜索(教程含源码)

使用QGIS将文本坐标转换为矢量文件

将 PDF 转换为矢量图 emf

将PDF文档转换为图片的方法

将word文档转换为html、PDF等

java 将Office文档转换为PDF

Java 将Word文档转换为PDF

Aspose.Words for .NET使用教程（七）：将文档转换为EPUB

借助WPS将Word文档转换为PPT文档

【TSP】基于matlab 改进的禁忌搜索算法之求解旅行商问题【含Matlab源码 241期】

将时间序列转换为分类问题

Aspose.Words for .NET使用教程（九）：将文档转换为字节数组和HTML

将数据库转换为word文档

C# 将Word文档转换为HTML

Java 将 Word 文档转换为 PDF 的完美工具

将word文档转换为markdown(.md)文件

将txt数据文档转换为Excel文件

JavaScript将字符串转换为文档下载

【软件操作】Office将Word文档转换为PDF格式

将二叉搜索树转换为双向链表

将栅格影像转换为CAD/GIS矢量的3种方法

如何将坐标数据（.xls）转换为矢量范围（.shp）

如何试用 Vectorizer.AI 将位图转换为矢量图

Vector Magic for Mac/win将图片转换为矢量，轻松实现高品质设计

通过pinyin4j将汉字转换为拼音

通过JS将列数字索引转换为字母

通过反射，将map转换为java对象

通过反射将Datetable转换为泛型List<T>

通过泛型，将string转换为指定类型

如何通过优化 Python 中的 GPU 使用率将视频处理速度提高 5 倍(教程含源码)

今日推荐

wlnmp 一键安装包更新 240522

ChatGPT 严重宕机，结果被造谣“遭遇俄罗斯黑客入侵”

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

周排行

mongodb 下载与安装与初步使用

20190530

iOS录制回放神器AutoTouch使用介绍

同心圆猜数字游戏

mamp pro安装redis扩展各个步骤截图

windows10下安装docker报错：error during connect

跨域授权 Federated Identity Pattern

js时间比较大小

pandas to_csv()使用方法

从JDK源码角度看Byte

每日归档

更多

2024-05-22(41)

2024-05-21(8)

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)