目次
1. オートエンコーダーが背景を生成する
画像分類、オブジェクト認識、画像セグメンテーションはすべて教師あり学習に基づいているため、大量のデータに手動でラベルを付ける必要があります。しかし、時代の発展と人工知能の継続的な人気に伴い、データ量の需要はもはや想像を超えており、データ量の需要は人々の認識をはるかに超えています。膨大なデータセットに直面して、データの分布 P(x) のアルゴリズムを学習する方法はあるでしょうか?
ヒント: 上記のアルゴリズムを解くときに、教師なし学習が計算されます。
- オートエンコーダ
- オートエンコーダ (autoencoder、AE) は、半教師あり学習および教師なし学習で使用される人工ニューラル ネットワーク(Artificial Neural Networks、ANN)の一種であり、その機能は、入力情報を学習対象として入力情報の表現を学習することです。 . (表現学習)
- オートエンコーダの原理 _
- エンコーダ (encoder) とデコーダ( decoder )の 2 つの部分が含まれています。学習パラダイムによれば、オートエンコーダーは、収縮型オートエンコーダー(収縮型オートエンコーダー) 、正則化オートエンコーダー(正則化オートエンコーダー)、変分オートエンコーダー (VAE)に分類できます。最初の 2 つは識別モデル、後者は生成モデルです 。構築のタイプに応じて、オートエンコーダはフィードフォワード構造またはリカレント構造を備えたニューラル ネットワークになります。
- オートエンコーダのアプリケーション シナリオ
- オートエンコーダは一般的な意味での学習アルゴリズムを表現する機能を持ち、次元削減や異常検出などに応用されています。畳み込み層で構築されたオートエンコーダーは、画像のノイズ除去、ニューラル スタイルの転送などを含むコンピューター ビジョンの問題に適用できます。
2. オートエンコーダの原理
(1) 一般的なニューラルネットワークの構造
ニューラル ネットワークの強力な非線形表現能力を低次元のデータ表現の学習に使用できるでしょうか? しかし、これには問題も発生します。ニューラル ネットワークの学習はラベルの条件下で行われます。教師なし学習の場合、ラベルはなく、入力データ自体 x だけが存在します。
(2) オートエンコーダ
エンコーダーからデコーダーへの最終出力が元の入力とほぼ等しいことが望ましいため、オートエンコーダーの最適化目標は次のようになります。
3. オートエンコーダの実装
(1) ネットワーク構成
(2) コードの実装
この記事のコードをダウンロードしてください: GitHub - KeepTryingTo/Pytorch-GAN: Pytorch を使用して GAN を実装するプロセス
参考書籍とリンク
「TensorFlowディープラーニング」