别魔改网络了，Google研究员：模型精度不高，是因为你的Resize方法不够好

其他 2021-11-24 13:06:57 阅读次数: 0

作者丨小马
编辑丨极市平台
本文原创首发于极市平台公众号，转载请获得授权并标明出处。

【写在前面】

尽管近年来卷积神经网络很大地促进了计算机视觉的发展，但一个重要方面很少被关注：图像大小对被训练的任务的准确性的影响 。通常，输入图像的大小被调整到一个相对较小的空间分辨率(例如，224×224)，然后再进行训练和推理。这种调整大小的机制通常是固定的图像调整器（image resizer）（如：双行线插值）但是这些调整器是否限制了训练网络的任务性能呢？ 作者通过实验证明了典型的线性调整器可以被可学习的调整器取代，从而大大提高性能 。虽然经典的调整器通常会具备更好的小图像感知质量（即对人类识别图片更加友好），本文提出的可学习调整器不一定会具备更好的视觉质量，但能够提高CV任务的性能。

在不同的任务中，可学习的图像调整器与baseline视觉模型进行联合训练。这种可学习的基于cnn的调整器创建了机器友好的视觉操作，因此在不同的视觉任务中表现出了更好的性能 。作者使用ImageNet数据集来进行分类任务，实验中使用四种不同的baseline模型来学习不同的调整器，相比于baseline模型，使用本文提出的可学习调整器能够获得更高的性能提升。

背景

目前的resize方法一般都是已经设计好的，不可学习的，典型的有NEAREST，BILINEAR，BICUBIC。

我们先来看看这些resize算法的不同效果：

原图：

NEAREST：

BILINEAR：

BICUBIC：

可以看出，对人来说，不同的resize方法差别还是蛮大的。那么对于模型来说应该采用什么样的resize方法呢？为此，作为提出了采用可学习的resizer model来对图片进行resize，以进一步提高CV任务的性能。

1. 论文和代码地址

Learning to Resize Images for Computer Vision Tasks

论文地址：https://arxiv.org/abs/2103.09950

代码地址：未开源

全文链接：别魔改网络了，Google研究员：模型精度不高，是因为你的Resize方法不够好

关注极市平台公众号，获取最新CV干货。
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/Extremevision/article/details/121496934

别魔改网络了，Google研究员：模型精度不高，是因为你的Resize方法不够好

觉得世界不够好，那你够好吗？

16 | 为什么你的测试不够好？

任正非内部讲话：不被西方国家认同因为做得还不够好

【子桓说】为什么事情做的不够好？因为违背了道

程序员修神之路--缓存架构不够好，系统容易瘫痪

有些ES6方法极简,但是性能不够好

小心眼是因为你运动量不够

SpiderStore链游解构评级第一期：加密英雄&EOS骑士，足够好又不够好

最出名的那些日历APP，结果一点都不够好用...

致 DBA：为什么你经常犯错，是因为你做的功课不够！

如果你一生碌碌无为是因为努力不够？

TED 不够幸运是因为不够努力 2018

.NET Core采用的全新配置系统[9]: 为什么针对XML的支持不够好？如何改进？

构建的Web应用界面还不够好看？DevExtreme v19.1全新主题来袭

不是朋友不够好，而是有些事只能我们自己去面对

Google 研究员披露 Windows 10 0day 漏洞

spfa的魔改方法

面试官说公司的 ES 性能不够好、集群不够稳定！被我展示的这些调优技巧惊呆了。。。

对\emph{Deep-learning-BN}模型算法的学习-谷歌研究员论文翻译Batch Normalization

大数据研究员：数据科学很大，在你身边很小

程序员浪漫的爱情：让自己变完美，只是因为你

模型不收敛是因为什么

MyEclipse中，当我们写一个类实现一个接口时，会自动生成重写该接口的方法，但是，方法的参数提示不够好，是什么原因导致的呢？该如何解决呢？

学STM32入门很难？那是因为你没掌握正确的方法！

手机内存总是不够用？还不是因为这个APP！你手机里肯定有！

人工智能研究员：你所想象的一切离我们并不遥远

程序员还在为变量取名苦恼，那是因为你不知道，这个变量命名神器

商汤科技见习视觉研究员面试

谷歌算法研究员：我为什么钟爱PyTorch？

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)