LLM 生成 AI プロジェクトのライフサイクル 生成 AI プロジェクトのライフサイクル

コースの残りの部分では、LLM 駆動のアプリケーションを開発および展開するために必要なスキルを学びます。このビデオでは、まさにそれを行うのに役立つ生成 AI プロジェクトのライフサイクルについて学びます。このフレームワークには、プロジェクトのアイデアから立ち上げまでに必要なタスクがリストされています。コースの終わりまでに、下す必要がある重要な決定、遭遇する可能性のある困難、アプリケーションの開発とデプロイに必要なインフラストラクチャについて、ある程度の直感が得られるはずです。これはライフサイクル全体の図です。
ここに画像の説明を挿入

段階的に説明していきます。

どのプロジェクトにおいても最も重要なステップは、範囲をできるだけ正確かつ具体的に定義することです。
ここに画像の説明を挿入

このコースで説明したように、LLM は多くのタスクを実行できますが、その機能はモデルのサイズとアーキテクチャに大きく依存します。特定のアプリケーションにおける LLM の機能を考慮する必要があります。

モデルが長いテキストの生成や高容量など、さまざまなタスクを実行できるようにする必要があるか、ここに画像の説明を挿入
それとも固有表現認識などのより特殊なタスクなので、モデルが得意とするのは 1 つのことだけですか。
ここに画像の説明を挿入

コースの残りの部分でわかるように、モデルで何を行う必要があるのか​​を明確にしておくと、時間の節約につながり、さらに重要なことに、計算コストも節約できます。満足し、モデルの要件を十分に特定したら、開発を開始できます。

最初に決定するのは、独自のモデルを最初からトレーニングするか、既存の基本モデルを使用するかです。通常は既存のモデルから開始しますが、場合によってはモデルを最初からトレーニングする必要がある場合もあります。
ここに画像の説明を挿入

この決定の背後にある考慮事項と、独自のモデルのトレーニングの実現可能性を見積もるのに役立ついくつかの経験則については、今週後半で学習します。

モデルを作成したら、次のステップはそのパフォーマンスを評価し、アプリケーションのニーズを満たすために追加のトレーニングを実行することです。
ここに画像の説明を挿入

今週初めに見たように、モデルのパフォーマンスを向上させるにはヒント エンジニアリングだけで十分な場合があるため、タスクとユースケースに適した例を使用して、まずコンテキスト学習を試してみるとよいでしょう。
ここに画像の説明を挿入

ただし、1 つまたはいくつかの短い推論であっても、モデルが期待どおりにパフォーマンスを発揮しない場合があります。その場合は、モデルを微調整してみることができます。
ここに画像の説明を挿入

この教師あり学習プロセスについては、第 2 週で詳しく説明します。第 2 週のラボでは、モデルを自分で微調整してみる機会があります。

モデルがより強力になるにつれて、モデルが展開時に適切にパフォーマンスを発揮し、人間の好みに合わせることを保証することがますます重要になります。第 3 週では、「人間のフィードバックを使用した強化学習」と呼ばれる追加の微調整テクニックを学習します。これは、モデルが適切に動作することを確認するのに役立ちます。
ここに画像の説明を挿入

これらすべてのテクニックの重要な側面は評価です。来週は、モデルがどの程度パフォーマンスを発揮するか、または設定と一致しているかを判断するために使用できるいくつかの指標とベンチマークを検討します。
ここに画像の説明を挿入
アプリケーション開発の適応と調整のこのフェーズは、非常に反復的な作業になる可能性があることに注意してください。
まず、エンジニアリングを促して出力を評価してみるとよいでしょう。
ここに画像の説明を挿入

次に、微調整を使用してパフォーマンスを向上させます。
ここに画像の説明を挿入

次に、ヒント エンジニアリングを再度確認して評価し、望ましいパフォーマンスを実現します。
ここに画像の説明を挿入

最後に、パフォーマンスのニーズを満たす適切に調整されたモデルがあれば、それをインフラストラクチャにデプロイし、アプリケーションと統合できます。
ここに画像の説明を挿入

この段階での重要なステップは、展開用にモデルを最適化することです。これにより、コンピューティング リソースを最大限に活用し、アプリケーションのユーザーに可能な限り最高のエクスペリエンスを提供できるようになります。
ここに画像の説明を挿入

最後の重要なステップは、アプリケーションが適切に機能するために必要な他のインフラストラクチャを検討することです。
ここに画像の説明を挿入

LLM には、答えがわからないときに情報を発明したり、複雑な推論や数学を実行する能力が限られているなど、トレーニングだけで克服するのが難しい基本的な制限があります。

コースの最後の部分では、これらの制限を克服するために使用できるいくつかの強力なテクニックを学びます。

ここで考えなければならないことがたくさんあることは承知していますが、今すぐにすべてを一度に吸収することを心配する必要はありません。コース全体で各フェーズの詳細を調査するときに、このアーキテクチャを何度も見ることになります。

参考

https://www.coursera.org/learn/generative-ai-with-llms/lecture/21Nwn/generative-ai-project-lifecycle

おすすめ

転載: blog.csdn.net/zgpeace/article/details/132418370