なぜネットワークが増加するにつれて、従来の多層ネットワーク構造の非線形表現ではアイデンティティ マッピングを表現することが難しくなり、モデルにネットワーク劣化の問題が発生するのでしょうか? アイデンティティ マッピングとは何ですか! !

ここに画像の説明を挿入します


1. ID マッピングとは何ですか?

アイデンティティ マッピングは、入力と出力間のまったく同じマッピング関係、つまり y=x を指します。これは非線形変換を行わない線形関数です。

ディープ ニューラル ネットワークの各層には、ReLU 関数などの非線形活性化関数があります。これにより 深层网络很难精确学习到一个恒等映射 になります。

その理由は次のとおりです。

  1. 各レイヤーの非線形アクティブ化により、入力信号に対してある程度の非線形変換が実行されます。レイヤーの数が増えると、この非線形変換は蓄積され、復元することが困難になります完全抵消出力を入力の元の外観に戻します。

  2. ディープ ネットワーク表达能力很强,容易过拟合の場合、学習された関数は単純な ID マッピングよりも複雑になる場合があります。

所以随着层数增加,深层网络很难学习到一个线性恒等映射函数,往往会出现网络退化的问题,即某些时候深层网络的性能不如浅层网络

2. ディープ ニューラル ネットワークの場合、アイデンティティ マッピングを維持する必要はありません。

ディープ ニューラル ネットワークの場合、特に でアイデンティティ マッピングを維持します并不是必需的。ディープ ニューラル ネットワークの主な目的は、特定の学習タスクをより適切に解決するために、 を通じて入力データの を学習することです。 处理复杂的任务时多层非线性变换高级抽象表示或特征

ただし在一些情况下,恒等映射是必需的。アイデンティティ マッピングは、入力と出力がまったく同じであること、つまりネットワークが入力に対していかなる変換も実行しないことを意味します。一部のタスクでは、このようなアイデンティティ マッピングは、画像のノイズ除去/復元タスクなど、入力コンテンツ自体がターゲット出力になるなど、望ましい結果になる場合があります。输出图像与输入图像尽量相同

さらに、アイデンティティ マッピングが導入されています主要解决网络退化问题。ネットワーク層の数が増加すると、 非线性变换可能使得网络性能下降 ますが、アイデンティティ マッピングを導入することで、 在一定程度上保留输入的信息减轻梯度消失和梯度爆炸的问题ネットワークを活用することで、より効果的にトレーニングを行うことができます。

3. ID マッピングは、ネットワークのいくつかの重要な特性を評価および分析するための単純なベンチマーク タスクとして使用できます。

  1. 用来测试网络是否过拟合: 非常に深いネットワークが単純なデータ セット (アイデンティティ マッピング データ セットなど) でうまく機能しない場合、より複雑なパターンが過剰適合され、単純なパターンを学習する能力が失われている可能性があります。

  2. 用来分析网络表达能力是否随层数增加而退化: ネットワークがアイデンティティ マッピングを学習できない場合、レイヤー数が増加するにつれて、特徴を抽出してモデルをモデリングする能力が低下する可能性があります。

  3. 用来测试优化算法是否有效: ネットワークがトレーニングを通じて ID マッピングなどの単純な機能を学習できない場合は、ネットワーク構造または最適化アルゴリズムに問題がある可能性があります。

  4. 恒等映射是一个基础的线性模型ネットワークがそれを学習できない場合は、ネットワークの線形パターンと非線形パターンの学習能力をさらに向上させる必要があることを示します。


おすすめ

転載: blog.csdn.net/qlkaicx/article/details/135025225