機械学習13-自己教師なし教師なし学習

1なぜ教師なし学習教師なし学習

自己監視学習は、教師なし学習の特別な方法です。教師なし学習で述べたように、ラベル付けは非常に価値があり、通常は手動でマーキングする必要があり、時間と人件費が非常に高くなります。しかし実際には、ラベルのないデータを取得することは比較的簡単です。私たちは、インターネット上の多くのテキスト、画像、音声、製品情報などをクロールできます。これらのラベルなしデータの使用方法は、常に教師なし学習の重要な方向性でした。自己管理学習はソリューションを提供します。

自己監視学習は、データの一部を使用して他の部分を予測し、監視信号を単独で提供することで、自己監視学習を実現します。自己監視学習を使用すると、特定のテキストまたは画像表現を学習できます。これは、下流のタスクの開発に有益です。これはpretrain-finetuneです

image.png

 

2自習学習実施計画

自己管理型学習の実装スキームには、主に次のものが含まれます

  1. データの一部を使用して、データ全体を再構築します。これは実際には一種のノイズ除去オートエンコーダです。NLPに関しては、BERTシリーズのマスク言語モデルとCVフィールドの画像復元インペインティングがこのスキームを使用します。
  2. CVフィールドのいくつかのタスク。例えば、絵を9つに分け、スクランブルした後、パズルを実行します。画像を特定の角度だけ回転させてから、回転角度を予測します。
  3. コントラスト学習。word2vec、Contrastive Predictive Coding、SimCLRなど

 

3 NLPの分野での自主学習

自己管理学習を使用して、さまざまなNLP事前トレーニングモデルが実装されます。Elmo、GPT、BERT、XLNet、Electra、T5など。それらはノイズ除去オートエンコーダーと見なすことができます。

image.png

3.1自動エンコーダと自動回帰LM

彼らは2つのタイプに分かれています

  1. 自動エンコーダ。たとえば、BERTで使用されるマスク言語モデル。シーケンス内のトークンの一部をマスクしてから、モデルにマスクの位置を予測させます。その利点は、両方向の文情報を十分に活用でき、分類、QA、およびNERなどのタスクで適切に実行できることです。欠点は、シーケンス内のマスク位置のみが予測に関与することであり、トレーニング効率が低くなります。さらに、トレーニング中はマスクがありますが、ダウンストリームタスクの微調整中にはマスクがないため、2つの段階で不整合が生じます。
  2. 自動回帰言語モデル自動回帰LM。厳密に言えば、MLMマスク言語モデルは言語モデルと見なすことはできません。GPTなどの自己回帰モデルは、実際の言語モデルです。上記を使用して、以下のトークンを予測します。生成タスクのパフォーマンスが向上します。利点は、事前学習と微調整の2つの段階が同じであり、シーケンスの各位置が予測に参加することで、学習効率が非常に高いことです。不利な点は、上記の内容のみが表示され、以下の内容(1つの方向)は表示されないことです。これは、文の意味の理解に大きな影響を与えます。

Auto-Encoderの例は次のとおりです。2つの方向でコンテキストを取得できるため、意味の理解に役立ちます。

image.png

自動回帰LMの例は次のとおりです。前から後ろへ、または後ろから前へ、それは一方向のみです。

image.png

 

3.2 XLNetとPLM

XLNetは2つの利点を組み合わせたもので、ランキング言語モデルPLM(順列LM)を提案します。2つのステップに分かれています

  1. トークンの順序を並べ替え、スクランブルします実際には、トークンは直接スクランブルされませんが、アテンションマスクが使用されます。
  2. 自己回帰言語モデルが予測します。トークンの位置が混乱しているため、言語モデルをトレーニングするときに次の情報を取得できます。これは、シーケンス全体の理解に役立ちます。

image.png

 

4 CVの分野での自主学習

CVタスクでは、自己監視学習も実装が簡単です

4.1欠けている部分を予測する

画像の一部の領域を切り取り、出力が入力画像をできるだけ復元できるようにモデルに予測をさせます。

image.png

 

4.2ジグソーパズル

画像を複数の領域に分割してスクランブルをかけ、モデルに元の画像に復元させます。ジグソーパズルによく似ています。

image.png

 

4.3回転

画像を特定の角度だけ回転させ、モデルが回転した角度をモデルに予測させます。または、画像を0度、90度、180度、および270度の4つのカテゴリに回転し、モデルに回転したカテゴリを予測させます。

image.png

おすすめ

転載: blog.csdn.net/u013510838/article/details/108553383