AI の新しいお気に入り: プロンプト学習、プロンプトを使用して大規模なモデルを学習および調整します

41775e7ebe3ff79decd4b8a68ae44dec.gif

「プロンプト学習」という言葉は多くの人にとって新しい用語ですが、プロンプト学習 と プロンプト の違いと関係は何ですか? 今日の大規模モデルの一部は「ヒント言語」をどのように利用しているのでしょうか? 今回の生放送授業では、AIパラダイムの変化から即時学習(Prompt Learning)と「プロンプト」の興味深い事例まで詳しくご紹介しました!Microsoft ATP で見てみましょう!

▍「大きな」モデルにアプローチする

現在、AI技術の核となるのは「モデル」という概念です。モデルとは何ですか? たとえば、下図の AI モデルは言語モデルです 。

7a657a00d82d9dfb95877a5da6c3dcff.png

ChatGPTのような大規模モデルは非常に複雑であるため、人間とほぼ同じくらいの知能を持っています。これは 1,750 億個のパラメーターを関数とする大規模なニューラル ネットワークであり、非常に表現力豊かです。

では、どのようにしてそのようなモデルを取得すればよいのでしょうか。初期の段階では、線形回帰、サポート ベクター マシン (SVM)、隠れマルコフ モデル (HMM)、条件付きランダム フィールド (CRF) など、下の図のニューラル ネットワークよりも単純になる可能性があります。 )待ってください。

3c4558ab12ac73dc2d945910ecd8903c.png

最も初期のトレーニングはゼロからのトレーニング、つまり最初からのトレーニングでしたが、その後問題が発生し、モデルはますます大きくなっていきました。2012 年から 2016 年にかけて、人工知能に関する多くの深層学習研究は、ニューラル ネットワークを統合する方法に焦点を当てました。層の数が増えると、その構造が複雑になり、結果が効果的に収束するようになります。

93421ed1e75370c6ac80bf1c1e23ce25.png

▍大型モデルと「ヒント学習」

「プロンプト学習」とは何ですか。対応する英語は Prompt Learning です。ChatGPT などの大規模なモデルがあり、モデル自体に変更を加えずに、つまり、事前トレーニングされたモデルの構造とパラメーターが更新されない場合、入力ヒントを追加し、下流タスクをテキスト生成タスクに変更します。

「学習の促進」と「促進」に関する興味深い例をもっと知りたい場合は、Microsoft ATP のB ステーション公式アカウント「Microsoft Zhihui AI」にアクセスして、ライブ授業のリプレイをご覧ください。

ライブ再生アドレス: https://www.bilibili.com/video/BV1ax4y1T7x4/?spm_id_from=333.999.0.0

Microsoft ATP の公式アカウントへようこそ

Microsoft ATP に関する直接情報を入手する

86cdc3198b771158b0e9d8f87c1e3a05.jpeg

3ac9850820074c12ebea5ea5ac9d7c2f.jpeg

613c5e51c5955428ff1b9bad1e7efcb7.jpeg

06da78a9cb6d8ac15ccbf8cf36399587.jpeg

7119b0d12fe5993ecc101fc3d418eb7d.gif

「原文を読む」をクリック | AIエンパワーメント事例を詳しく見る

Supongo que te gusta

Origin blog.csdn.net/YeJuliaLi/article/details/130097314
Recomendado
Clasificación