NeurlPS 论文阅读(1) - Neural Ordinary Differential Equations

其他 2019-01-16 01:07:47 阅读次数: 0

戳这篇博客，很详细了

概要

引入新的网络概念——OdeNet，常微分方程，连续的深度神经网络。

1. 介绍

残差模块在这里插入图片描述
假设当我们添加更多的层，会发生什么?

内存效率

不储存任何前向传播的参数。在第2节，我们展示了如何依靠ODE输入计算标量值损失的梯度。

自适应计算

Euler 方法是解决Ode最简单的方法

参数效率

当隐藏单元参数化为时间的连续函数时，附近“层”的参数自动地绑定在一起。在第3节中，我们展示了这一点这减少了监督学习任务所需的参数数量。

可逆可拓展的标准化流

使连续变量变得容易计算。在第4节中，我们推导出这个结果并用它构建了一类新的可逆密度模型，避免了单个单元规范化流量的瓶颈，可以通过最大可能性直接训练。

连续时间序列

与循环神经网络的离散观察和时间间隔不同的是，ODE可以引用任何时间的数据。
在第5节证明了我们的模型。

2. Reverse-mode automatic differentiation of ODE solutions

主要技术难点是反向传播，前向传播虽然容易，但也引入了高的存储成本和额外的数值误差

在与 ResNet 的类比中，我们基本上已经了解了 ODEnet 的前向传播过程。首先输入数据 Z(t_0)，我们可以通过一个连续的转换函数（神经网络）对输入进行非线性变换，从而得到 f。随后 ODE Solver 对 f 进行积分，再加上初值就可以得到最后的推断结果。如下所示，残差网络只不过是用一个离散的残差连接代替 ODE Solver。
在这里插入图片描述
若我们的损失函数为 L()，且它的输入为 ODE Solver 的输出：

梯度计算方法，绕过ODE Solver

我们的目的是利用 ODESolver 从 z(t_1) 求出 z(t_0)、从 a(t_1) 按照方程 4 积出 a(t_0)、从 0 按照方程 5 积出 dL/dθ。最后我们只需要使用 dL/dθ 更新神经网络 f(z(t), t, θ) 就完成了整个反向传播过程。

猜你喜欢

转载自blog.csdn.net/qq_37717661/article/details/85394967

NeurlPS 论文阅读(1) - Neural Ordinary Differential Equations

论文笔记Neural Ordinary Differential Equations

PP: Neural ordinary differential equations

NIPS2018最佳论文解读：Neural Ordinary Differential Equations

【论文夜读】陈天琦神作Neural Ordinary Differential Equations(NuerIPS2018最佳paper)

常微分方程ODE和Neural Ordinary Differential Equations

Transfer learning for deep neural network-based partial differential equations solving论文笔记

The Application of Eigenvectors and Eigenvalues to Differential Equations

SCORE-BASED GENERATIVE MODELING THROUGH STOCHASTIC DIFFERENTIAL EQUATIONS 阅读笔记

常微分方程 ODE -- Differential Equations and Solutions

用ode45解一个带有积分的微分方程（integro-differential equations）

Training Neural Networks with Weights and Activations Constrained to +1 or -1论文阅读

蚂蚁集团持续发力生成式AI，20篇论文入选AI顶会NeurlPS

【论文阅读】(TEVC 2022)A Meta-Knowledge Transfer-Based Differential Evolution for Multitask Optimization

论文阅读笔记：Distilling the Knowledge in Neural Network

Distilling the Knowledge in a Neural Network[论文阅读笔记]

【论文阅读】Sequence to Sequence Learning with Neural Network

MUNN：Mutation Analysis of neural networks论文阅读

【论文阅读】Sequence to Sequence Learning with Neural Networks

【论文阅读】Non-local Neural Networks

【论文阅读】A Neural Probabilistic Language Model

『论文阅读』：Convolutional Neural Networks for Sentence Classification

A Neural Probabilistic Language Model 论文阅读及实战

A Survey on Neural Architecture Search论文阅读

《Progressive Neural Architecture Search》论文阅读笔记

Non-local Neural Networks论文阅读

【论文阅读】Scaling Laws for Neural Language Models

On the Spectral Bias of Neural Networks论文阅读

【论文学习2】 Differential Privacy Reinforcement Learning

知识蒸馏（Distillation）相关论文阅读（1）——Distilling the Knowledge in a Neural Network（以及代码复现）

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)