benchmark & baseline

其他 2021-03-27 09:42:37 阅读次数: 0

benchmark

一个算法之所以被称为benchmark，是因为它的性能已经被广泛研究，人们对它性能的表现形式、测量方法都非常熟悉，因此可以作为标准方法来衡量其他方法的好坏。
这里需要区别state-of-the-art（SOTA），能够称为SOTA的算法表明其性能在当前属于最佳性能。如果一个新算法以SOTA作为benchmark，这当然是最好的了，但如果比不过SOTA，能比benchmark要好，且方法有一定创新，也是可以发表的。

benchmark中除了dataset，应该还包括做对比的基准算法，以及评估标准。

baseline

通俗的讲，一个算法被称为baseline，基本上表示比这个算法性能还差的基本上不能接受的，除非方法上有革命性的创新点，而且还有巨大的改进空间和超越benchmark的潜力，只是因为是发展初期而性能有限。所以baseline有一个自带的含义就是“性能起点”。这里还需要指出其另一个应用语境，就是在算法优化过程中，一般version1.0是作为baseline的，即这是你的算法能达到的一个基本性能，在算法继续优化和调参数的过程中，你的目标是比这个性能更好，因此需要在这个base line的基础上往上跳。

简而言之，

baseline是比较算法好坏中作为“参照物”而存在的，在比较中作为基线；

benchmark本身是评价算法好坏的一种规则和标准。

benchmark一般是和同行中比较牛的算法比较，比牛算法还好，那你可以考虑发好一点的会议/期刊；
baseline一般是自己算法优化和调参过程中自己和自己比较，目标是越来越好，当性能超过benchmark时，可以发表了，当性能甚至超过SOTA时，恭喜你，考虑投顶会顶刊啦。

作者：Anonymous
链接：https://www.zhihu.com/question/28823373/answer/101504099

猜你喜欢

转载自blog.csdn.net/Zhou_Dao/article/details/108803952

benchmark & baseline

baseline, benchmark, sota, backbone

[转载]Benchmark和baseline的区别

benchmark和baseline的区别和联系

【简单易懂】Benchmark和baseline的区别！

常规数据集benchmark，baseline的整理（持续更新）

论文中的baseline、benchmark、SOTA(state-of-the-art)释义解释

Baseline

【论文翻译】A Benchmark and a Baseline for Robust Multi-view Depth Estimation（3DV 2022）

Benchmark

深度学习常见名词概念：Sota、Benchmark、Baseline、端到端模型、迁移学习到底指什么

RGB-T追踪——【多模态融合】Visible-Thermal UAV Tracking: A Large-Scale Benchmark and New Baseline

基线 baseline

My baseline

apache benchmark

Benchmark简介

benchmark问题？

【ML/NLP】baseline

baseline_1

深度学习中的baseline

简单概念-BaseLine,PipeLine

推荐算法之Baseline

情感分析Baseline

机器学习中的baseline

Reid baseline demo

Baseline（基线）是什么？

BaseLine and find_peak

【布局 widget】Flutter Baseline

Uncertainty Guided Method Baseline

Baseline设计原理（Xilinx）

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)