代わりに隠された層の離散順序を指定するので、私たちは、ニューラルネットワークを使用して隠された状態の導関数をパラメータ化。
前:隠された層の離散シーケンス。
後:隠された状態の誘導体です。
伝統的な方法:残留ネットワーク、RNNデコーダ、および正規化は、隠された状態への変換のシーケンスを構成することにより、ビルド複雑な変換を流れます。
私たちは、常微分方程式(ODE)常微分函数を使って隠れユニットの連続ダイナミクスをパラメータ化。
時間(T)の関数として、ニューラルネットワークは、H(t)の分布を知ることができ、入力層H(0)---->出力層H(T)。