EfficientNet笔记 - 代码天地

EfficientNet笔记

其他 2021-03-08 17:04:09 阅读次数: 0

传统的三个方式：扩大输入的分辨率、扩大深度、扩大宽度
在这里插入图片描述
(a)是基本模型，（b）是增加宽度，（c）是增加深度，（d）是增大属兔图像分辨率，（d）是EfficientNet，它从三个维度均扩大了，但是扩大多少，就是通过作者提出来的复合模型扩张方法结合神经结构搜索技术获得的。

作者指出，模型扩张的各个维度之间并不是完全独立的，比如说，对于更大的分辨率图像，应该使用更深、更宽的网络，这就意味着需要平衡各个扩张维度，而不是在单一维度张扩张。

如下图所示，直线上的每个点表示具有不同宽度系数（w）的模型。第一个基线网络（d=1.0，r=1.0）有18个卷积层，分辨率224x224，而最后一个基线（d=2.0，r=1.3）有36个卷积层，分辨率299x299。这个图说明了一个问题，为了追求更好的精度和效率，在ConvNet缩放过程中平衡网络宽度、深度和分辨率的所有维度是至关重要的。

在这里插入图片描述

固定公式中的φ=1，然后通过网格搜索（grid search）得出最优的α、β、γ，得出最基本的模型EfficientNet-B0.
固定α、β、γ的值，使用不同的φ，得到EfficientNet-B1, …, EfficientNet-B7
φ的大小对应着消耗资源的大小，相当于：

当φ=1时，得出了一个最小的最优基础模型；
增大φ时，相当于对基模型三个维度同时扩展，模型变大，性能也会提升，资源消耗也变大。
在这里插入图片描述
深度可分离卷积
用的是groups来控制，groups=in_channel~~

    def _conv_dw(self, in_channels, out_channels, stride):
        return nn.Sequential(
            nn.Conv2d(in_channels, in_channels, kernel_size=3, stride=stride, padding=1, groups=in_channels, bias=False),
            nn.BatchNorm2d(in_channels),
            nn.ReLU(),
            nn.Conv2d(in_channels, out_channels, kernel_size=1, stride=1, padding=0, bias=False),
            nn.BatchNorm2d(out_channels),
            nn.ReLU(),
        )

在这里插入图片描述
b1 - b7都是b0—主要是深度可分离卷积 + SE模块扩充的，所以没啥好记得，就是根据搜索得到的好的结构。参数主要是宽度，深度，dropout，输入的分辨率。

在这里插入图片描述

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/caihuanqia/article/details/113957437

EfficientNet笔记

EfficientNet学习笔记

EfficientNet论文笔记

EfficientNet

机器学习笔记 - EfficientNet论文解读

RCNN学习笔记- efficientnet源码分析

RCNN学习笔记- efficientnet2源码分析

EfficientNet 简介

论文阅读笔记 | 目标检测算法——EfficientDet（EfficientNet+BiFPN）

基础网络之EfficientNet

AI实战：谷歌 EfficientNet

EfficientNet网络详解

EfficientNet理论讲解

EfficientNet V2

【笔记】Backbone（经典主干网络）：VGGNet、GoogLeNet、ResNet、ResNet变种、SENet、SKNet、DarkNet-19、DarkNet-53、EfficientNet

【EfficientNet】《EfficientNet：Rethinking Model Scaling for Convolutional Neural Networks》

速度与精度的结合 - EfficientNet 详解

深度学习入门----EfficientNet解读

EfficientNet:更小，更快，更准

EfficientNet详解：当前最强网络

EfficientNet的解读与Tensorflow 2.0实现

EfficientNet 分类花数据集

利用Pytorch实现EfficientNet网络

【Pytorch】使用EfficientNet进行图像分类预测

基于EfficientNet的目标识别仿真

EfficientNet号称是最好的分类网络

EfficientNet训练自己的烟火识别算法

python烟火检测pytorch抽烟检测EfficientNet

EfficientNet代码复现--ICML2019

第九课：EfficientNet学习

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)