数ショットの基本概念

  • 少数ショット学習

https://www.youtube.com/watch?v=UkQ2FVpDxHg&list=PLvOO0btloRnuGl5OJM37a8c6auebn-rH2&index=1&t=3s

1. 問題の概要

少ないサンプルでの分類/回帰

4 つの画像が与えられた場合、人間はおそらくクエリ画像が何であるかを理解できるでしょう。

同様に、マシンもそれを認識する必要があります。

サポート セット: 小規模なデータ セット (各タイプの 2 つの画像など)。このように少数のサンプルでは、​​モデルをトレーニングするには十分ではありません。

従来の教師あり学習: 機械にトレーニング セットで学習させてから、テスト セットで一般化します。

少数ショット学習: 機械に自ら学習させる。

大規模なデータセットでは、少数ショット学習では、nn にゾウ/トラが何であるかを認識させず、これまで見たことのないゾウ/トラを識別することはできません。学習の目的は、物事の違いを理解し、異なるものを区別できるようにすることです。2 つの画像が与えられた場合、それらが何であるかではなく、それらが同じかどうかを学びます。

モデルをトレーニングした後、モデルに次の質問をすることができます。

ビッグデータセットを見ると、リスはまったく存在しません。モデルはリスを知りませんが、物事の類似点と相違点を知っており、それらが同じであると伝えることができます。

別の言い方でこう言いました。

クエリ画像を渡して、nn、これは何ですか? と尋ねます。訓練中にこんな光景は見たことがありません。

6 枚の画像を含む追加のサポート セットを彼女に渡し、それらがキツネであることを伝えます。

NN はクエリを受け取り、それをサポートと順番に比較したところ、それがカワウソに最も似ていることがわかりました。したがって、クエリは otter である必要があります。

サポート セット: ラベル付きの用語。スケールは小さく、カテゴリごとに 1 つまたは複数の画像があります。予測を行う場合は、追加情報を抽出します。

トレーニング セット: 非常に大きく、各カテゴリに多くの画像が含まれています。

コア: ディープ ニューラル ネットワークなどの大規模なモデルをトレーニングするのに十分な大きさのモデルを使用します。トレーニングの目的は、モデルにゾウやトラなどのような動作を学習させることではありません。代わりに、モデルは物事の類似点と相違点を学習し、トレーニング セットにカワウソ カテゴリがない場合でも、サポート セットに基づいてキーが何であるかを知ることができます。

2. 少数ショット学習とメタ学習

従来の教師あり学習: モデルはトレーニング セットで学習し、テスト セットに一般化します。

メタ学習:学ぶことを学ぶ。

たった 1 枚のカードでカワウソになることを学ぶのは、一発学習です。

モデルはこのハスキー犬を見たことがありませんが、トレーニング セットには何百頭ものハスキー犬がおり、モデルには一定の汎化能力があります。

モデルはこのウサギを見ていないだけでなく、ウサギ カテゴリのすべての画像も見たことがありません。

したがって、モデルには小さなカードを表示する必要があります。

6ウェイワンショット

カテゴリが増えると、分類精度が低下します。

6 つから 1 つを選択するよりも、3 つから 1 つを選択する方が明らかに正確です。

参照サンプルが多ければ多いほど、予測は容易になります。

3. 少数ショット学習の問題を解決する

基本的な考え方: 類似性を学習する関数を学習します。

  

4. データセット

メタ ラーニングを行う場合は、標準データ セットを使用してアルゴリズムの品質を評価する必要があります。

手書きの数字は証拠に属します。

1600 カテゴリ、各カテゴリは 20 枚の画像で構成されます

おすすめ

転載: blog.csdn.net/gaotihong/article/details/124985155