信息检索评价指标总结 - 代码天地

信息检索评价指标总结

其他 2018-07-18 05:09:37 阅读次数: 0

参考: 参考博客

MAP(Mean Average Precision)：

单个主题的平均准确率是每篇相关文档检索出后的准确率的平均值。主集合的平均准确率(MAP)是每个主题的平均准确率的平均值。MAP 是反映系统在全部相关文档上性能的单值指标。系统检索出来的相关文档越靠前(rank 越高)，MAP就可能越高。如果系统没有返回相关文档，则准确率默认为0。

NDCG(Normalized Discounted CumulativeGain)：

分为四步:

设定相关性等级（2^5-1, 2^4-1…）
计算累计增益值
计算折算因子log(2)/log(1+rank) （越靠前的，越容易被点击）
归一化到NDCG，为了不同等级上的搜索结果的得分值容易比较
4.1. 首先计算理想list的MaxDCG
4.2 相除即可

计算相对复杂。对于排在结位置n处的NDCG的计算公式如下图所示：

(1)在MAP中，四个文档和query要么相关，要么不相关，也就是相关度非0即1。NDCG中改进了下，相关度分成从0到r的r+1的等级(r可设定)。当取r=5时，等级设定如下图所示：

(应该还有r=1那一级，原文档有误，不过这里不影响理解)

(2)例如现在有一个query={abc}，返回下图左列的RankedList(URL)，当假设用户的选择与排序结果无关(即每一级都等概率被选中)，则生成的累计增益值如下图最右列所示：

(3)考虑到一般情况下用户会优先点选排在前面的搜索结果，所以应该引入一个折算因子(discountingfactor): log(2)/log(1+rank)。(从上往下,依次为1,0.63,0.50...)这时将获得DCG值(Discounted Cumulative Gain)如下如所示：

(4)最后，为了使不同等级上的搜索结果的得分值容易比较，需要将DCG值归一化的到NDCG值。操作如下图所示，首先计算理想返回结果List的DCG值(即第一个为perfect,其余为excellent)：

然后用DCG/MaxDCG就得到NDCG值，如下图所示：

猜你喜欢

转载自blog.csdn.net/qq_41058526/article/details/80250926

信息检索评价指标总结

信息检索的评价指标

信息检索评价指标

图像检索：信息检索评价指标mAP

信息检索(IR)的评价指标介绍

图像检索-评价指标

信息检索的评价指标(Precision, Recall, F-score, MAP)

信息检索IR评价中常见的评价指标-MAP\NDCG\ERR\P@10等

检索模型及评价指标小结

图像检索评价指标mAP

信息检索评估指标

信息检索的评价指标——召回率、准确率、ROC、AUC

信息检索的评价指标(Precision、Recall、F-score、MAP、ROC、AUC)

信息检索常用的评价指标整理 MAP nDCG ERR F-measure Precision Recall

信息检索中 (IR) 的评价指标: P@n, MAP, MRR, DCG, NDCG

回顾及总结--评价指标（回归指标）

回顾及总结--评价指标（分类指标）。

信息检索评价标准计算

跨媒体检索评价指标——MAP和CMC曲线

信息检索概论总结

风控模型评价指标总结

推荐系统排序（Rank）评价指标总结

ROC AUC 所有评价指标总结

机器学习的回归评价指标——总结

深度学习评价指标总结及代码实现

机器学习的常用评价指标总结

评价指标

信息检索导论第八章-信息检索的评价

机器学习算法常用评价指标总结[Algorithm]

机器学习模型相关评价指标最全总结

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)