[ディープラーニングノート畳み込みニューラルネットワークアーキテクチャ]

共通アーキテクチャ

CNN のアーキテクチャには通常、次の層が含まれます。

1.畳み込み層

この層は CNN の最も重要な部分であり、コンボリューション カーネルを使用して入力画像から特徴を抽出します。各コンボリューション カーネルは画像上をスライドし、各位置の特徴応答を計算します。複数のコンボリューション カーネルは、エッジ、色、テクスチャなどのさまざまな特徴を抽出できます。

2. プーリング層

このレイヤーは、特徴マップをダウンサンプリングするために使用され、最も重要な特徴を維持しながら特徴マップのサイズを削減します。一般的なプーリング方法には、最大プーリングと平均プーリングが含まれます。

3. 活性化層

この層は、CNN がより複雑な特徴を学習できるように、非線形性を導入するために使用されます。一般的な活性化関数には、ReLU、Sigmoid、tanh などが含まれます。

4. 全結合層

この層は、以前の特徴マップを 1 次元ベクトルに変換し、完全に接続されたニューラル ネットワークを使用して分類します。

5.ソフトマックス層

この層は、分類確率を計算し、最終的な分類結果を出力するために使用されます。

一般に、入力層はネットワークへの入力であり、画像、音声、テキストなどのデータが可能です。畳み込み層は畳み込みニューラル ネットワークのコア層であり、畳み込み演算を使用して画像特徴を抽出します。畳み込み層には通常、複数の畳み込みカーネルが含まれており、各畳み込みカーネルは異なる特徴を抽出できます。コンボリューション演算は、コンボリューションカーネルを画像の各位置にスライドさせることで、各位置の特徴量を計算します。プーリング層は、特徴マップの解像度を下げ、計算量を減らし、モデルの堅牢性をある程度向上させるために使用されます。通常、これは最大プーリングまたは平均プーリングを使用して行われます。全結合層は、畳み込み層とプーリング層の出力を出力層に接続するために使用されます。最後に出力層があり、これは特定のタスクに応じて分類器またはリグレッサーになります。

おすすめ

転載: blog.csdn.net/fly_ddaa/article/details/129898771