ResNeXt：Aggregated Residual Transformations for Deep Neural Networks - 代码天地

ResNeXt：Aggregated Residual Transformations for Deep Neural Networks

其他 2020-03-13 00:17:30 阅读次数: 0

作者提出 ResNeXt 的主要原因在于：传统的要提高模型的准确率，都是加深或加宽网络，但是随着超参数数量的增加（比如channels数，filter size等等），网络设计的难度和计算开销也会增加。因此本文提出的
ResNeXt 结构可以在不增加参数复杂度的前提下提高准确率，同时还减少了超参数的数量（得益于子模块的拓扑结构一样，后面会讲）。

作者在论文中首先提到VGG，VGG主要采用堆叠网络来实现，之前的 ResNet 也借用了这样的思想。然后提到 Inception 系列网络，简单讲就是 split-transform-merge 的策略，但是 Inception 系列网络有个问题：网络的超参数设定的针对性比较强，当应用在别的数据集上时需要修改许多参数，因此可扩展性一般。

于是重点来了，作者在这篇论文中提出网络 ResNeXt，同时采用 VGG 堆叠的思想和 Inception 的 split-transform-merge 思想，但是可扩展性比较强，可以认为是在增加准确率的同时基本不改变或降低模型的复杂度。这里提到一个名词cardinality，原文的解释是the
size of the set of transformations，如下图 Fig1 右边是 cardinality=32 的样子，这里注意每个被聚合的拓扑结构都是一样的(这也是和 Inception 的差别，减轻设计负担

点明了增加 cardinality 比增加深度和宽度更有效。

当然还有一些数据证明 ResNeXt 网络的优越性，例如原文中的这句话：In particular, a 101-layer ResNeXt is able to achieve better accuracy than ResNet-200 but has only 50% complexity.

Table1 列举了 ResNet-50 和 ResNeXt-50 的内部结构，另外最后两行说明二者之间的参数复杂度差别不大。

接下来作者要开始讲本文提出的新的 block，举全连接层（Inner product）的例子来讲，我们知道全连接层的就是以下这个公式：

猜你喜欢

转载自www.cnblogs.com/ziwh666/p/12483765.html

ResNeXt : Aggregated Residual Transformations for Deep Neural Networks

ResNeXt - Aggregated Residual Transformations for Deep Neural Networks

ResNeXt：Aggregated Residual Transformations for Deep Neural Networks

【论文阅读】Aggregated Residual Transformations for Deep Neural Networks Saining（ResNext）

Aggregated Residual Transformations for Deep Neural Networks

《2017-Aggregated Residual Transformations for Deep Neural Networks》论文阅读

『Aggregated Residual Transformations for Deep Neural Networks』论文笔记

Aggregated Residual Transformations for DeepNeural Networks -ResNetXt2017【论文理解】

Deep Residual Networks（ResNet）简介

Identity Mappings in Deep Residual Networks

Improving Deep Neural Networks

Neural Networks and Deep Learning

Efficient Deep Neural Networks

解密ResNet：Identity Mappings in Deep Residual Networks

《17.Deep Pyramidal Residual Networks》

《Neural networks and deep learning》概览

Deep Neural Networks for Object Detection

Neural Networks and Deep Learning(1)

Neural networks and deep learning 概览

Neural Networks and Deep Learning 整理

Neural Networks and Deep Learning 笔记

Improving Deep Neural Networks[2]

Improving Deep Neural Networks [1]

Improving Deep Neural Networks[3]

Deep learning - Introduction to Neural Networks

009 Improving Deep Neural Networks

Neural Networks and Deep Learning (Week 2)——Neural Networks Basics

NEURAL NETWORKS（neural networks and deep learning by Charu C. Aggarwa）

Neural Networks and Deep Learning (Week 3)——Shallow neural networks

Going Deeper in Spiking Neural Networks：VGG and Residual Architectures笔记

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)