信息检索模型 - 代码天地

信息检索模型

其他 2018-06-02 19:07:27 阅读次数: 0

语言模型（Language Model）

基于统计语言模型的检索模型于1998年首次提出，借鉴了语音识别领域采用的语言模型技术。
一类最简单的语言模型与一个概率有穷自动机等价。
在一元语言模型中，词出现的先后次序无关紧要，因此，这类模型也往往称为词袋模型

I. 基本思想
区别于其他大多数检索模型从查询到文档（即给定用户查询，如何找出相关的文档），语言模型由文档到查询，即为每个文档建立不同的语言模型，判断由文档生成用户查询的可能性有多大，然后按照这种生成概率由高到低排序，作为搜索结果。

II. 生成查询概率
为每个文档建立一个语言模型，语言模型代表了单词（或单词序列）在文档中的分布情况。针对查询中的单词，每个单词都有一个抽取概率，将这些单词的抽取概率相乘就是文档生成查询的概率。

III. 存在问题
由于一个文档文字内容有限，所以很多查询词都未在文中出现过，生成概率为0，会导致查询整体的生成概率为0,这被称为语言模型的数据稀疏问题，是语言模型方法重点需要解决的问题。

IV. 解决方案
一般采用数据平滑方式解决数据稀疏问题。语言模型检索方法则是为所有单词引入一个背景概率做数据平滑。

原文链接：https://blog.csdn.net/zealfory/article/details/78069043

猜你喜欢

转载自www.cnblogs.com/Coeus-P/p/9126197.html

信息检索模型

网络信息检索（一）检索模型：布尔，向量，概率检索

信息检索

HyDE、UDAPDR（LLM大模型用于信息检索）

改进 Elastic Stack 中的信息检索：引入 Elastic Learned Sparse Encoder，我们的新检索模型

关闭word信息检索

地理信息检索

信息检索的评价指标

信息检索·论文写作

《信息检索》课程笔记

信息检索考试参考

信息检索评价指标

信息检索评估指标

4.4.1 演绎信息的检索

信息检索概论总结

信息检索概述

【导航】信息检索

信息检索数据集

信息检索笔记

网络信息检索

【829】【信息检索】【目录】

信息检索-1

多模态智能信息检索技术设计及分类模型设计

详解预训练模型在信息检索第一阶段的应用

ACL2023 | 面向信息检索的结构感知语言模型训练方法

概率检索模型

检索问答模型

信息检索之——布尔检索（Boolean Retrieval）

图像检索：信息检索评价指标mAP

信息检索格式布尔检索式

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)