EfficientNetV2: Smaller Models and Faster Training学习

业界资讯 2023-06-19 07:08:26 阅读次数: 0

摘要

本文介绍了EfficientNetV2，这是一系列新的卷积神经网络，其训练速度更快，参数效率也比先前的模型更好。为了开发这些模型，我们使用了一种结合了训练感知神经架构搜索和缩放的方法，以共同优化训练速度和参数效率。这些模型是从增加了新操作（例如融合-MBConv）的搜索空间中搜索得到的。我们的实验证明，EfficientNetV2模型的训练速度比最先进的模型快得多，同时模型尺寸可减小多达6.8倍。

我们的训练可以通过在训练过程中逐渐增加图像尺寸来进一步加快速度，但这往往会导致准确性下降。为了弥补这种准确性下降，我们提出了一种改进的渐进学习方法，它能够自适应地调整正则化（例如数据增强）以及图像尺寸。

通过渐进学习，我们的EfficientNetV2在ImageNet和CIFAR/Cars/Flowers数据集上显著优于之前的模型。通过在相同的ImageNet21k上进行预训练，我们的EfficientNetV2在ImageNet ILSVRC2012上实现了87.3%的Top-1准确率，比最近的ViT模型高出2.0%的准确率，同时使用相同的计算资源训练速度提高了5倍至11倍。代码可在https://github.com/google/automl/tree/master/efficientnetv2上获取。

介绍

训练效率对于深度学习非常重要，因为模型规模和训练数据量越来越大。例如，GPT-3（Brown等，2020）拥有更大的模型和更多的训练数据，在少样本学习方面展示了卓越的能力，但它需要数周的训练时间和数千个GPU，这使得重新训练或改进变得困难。

"TPU days"指的是使用TPU&#x

猜你喜欢

转载自blog.csdn.net/dragon_T1985/article/details/130784495

EfficientNetV2: Smaller Models and Faster Training学习

【经典网络】EfficientNetV2

pytorch 训练EfficientnetV2

EfficientNetV2网络详解

pytorch搭建EfficientnetV2网络

EfficientNet系列(1): EfficientNetV2网络详解

论文翻译：Make Skeleton-based Action Recognition Model Smaller, Faster and Better

12 _Custom Models and Training with TensorFlow_2_progress_status_bar_Training Loops_concrete

[blog] Training Sequence Models with Attention

【神经网络】(18) EfficientNetV2 代码复现，网络解析，附Tensorflow完整代码

【分类网络】EfficientNetV2网络详解和搭建

保姆级使用PyTorch训练与评估自己的EfficientNetV2网络教程

YOLOv5改进系列（9）——替换主干网络之EfficientNetv2

Compact Multi-Signatures for Smaller Blockchains学习笔记

[Week 2] LeetCode 335. Count of Smaller Numbers After Self

PDM：Training Models of Shape from Sets of Examples

ASM: Active Shape Models--Their Training and Application

Django学习--models(模型)

Django的学习（三）————models

Training Faster RCNN with Online Hard Example Mining

Keras版Faster-RCNN代码学习（Batch Normalization）2

faster-rcnn学习

Faster RCNN 学习与研究

Faster RCNN学习

Faster RCNN学习笔记

faster rcnn学习（二）

faster rcnn学习（一）

Faster RCNN 学习与实现

YOLOv5改进 | 主干篇 | EfficientNetV2均衡缩放网络改进特征提取层

models

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

女程序员是这样被恶搞的

B/S 和 C/S 的优缺点

vector一直申请会怎样？

座头鲸识别比赛(Humpback Whale Identification)总结

Linux高性能服务器编程——I/O复用 select

Mysql连接数据库（当包使用）

通过URI获取的文件路径为null的解决方法

1022-Primes on Interval(素数筛选+二分查找) ZCMU

Python出现： TypeError: expected string or buffer

bzoj2434: [Noi2011]阿狸的打字机 ac自动机+树状数组

每日归档

更多

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)