「プロンプト学習」という言葉は多くの人にとって新しい用語ですが、プロンプト学習 と プロンプト の違いと関係は何ですか? 今日の大規模モデルの一部は「ヒント言語」をどのように利用しているのでしょうか? 今回の生放送授業では、AIパラダイムの変化から即時学習(Prompt Learning)と「プロンプト」の興味深い事例まで詳しくご紹介しました!Microsoft ATP で見てみましょう!
▍「大きな」モデルにアプローチする
現在、AI技術の核となるのは「モデル」という概念です。モデルとは何ですか? たとえば、下図の AI モデルは言語モデルです 。
ChatGPTのような大規模モデルは非常に複雑であるため、人間とほぼ同じくらいの知能を持っています。これは 1,750 億個のパラメーターを関数とする大規模なニューラル ネットワークであり、非常に表現力豊かです。
では、どのようにしてそのようなモデルを取得すればよいのでしょうか。初期の段階では、線形回帰、サポート ベクター マシン (SVM)、隠れマルコフ モデル (HMM)、条件付きランダム フィールド (CRF) など、下の図のニューラル ネットワークよりも単純になる可能性があります。 )待ってください。
最も初期のトレーニングはゼロからのトレーニング、つまり最初からのトレーニングでしたが、その後問題が発生し、モデルはますます大きくなっていきました。2012 年から 2016 年にかけて、人工知能に関する多くの深層学習研究は、ニューラル ネットワークを統合する方法に焦点を当てました。層の数が増えると、その構造が複雑になり、結果が効果的に収束するようになります。
▍大型モデルと「ヒント学習」
「プロンプト学習」とは何ですか。対応する英語は Prompt Learning です。ChatGPT などの大規模なモデルがあり、モデル自体に変更を加えずに、つまり、事前トレーニングされたモデルの構造とパラメーターが更新されない場合、入力ヒントを追加し、下流タスクをテキスト生成タスクに変更します。
「学習の促進」と「促進」に関する興味深い例をもっと知りたい場合は、Microsoft ATP のB ステーション公式アカウント「Microsoft Zhihui AI」にアクセスして、ライブ授業のリプレイをご覧ください。
ライブ再生アドレス: https://www.bilibili.com/video/BV1ax4y1T7x4/?spm_id_from=333.999.0.0
Microsoft ATP の公式アカウントへようこそ
Microsoft ATP に関する直接情報を入手する
「原文を読む」をクリック | AIエンパワーメント事例を詳しく見る