Baidu Shen Dou: 「クラウドとインテリジェンスの統合」をアップグレードして、大規模モデル サービスの「スーパー ファクトリー」を構築

⭐はじめに

10月17日、Baidu World 2023が北京首港公園で開催された。Baidu Intelligent Cloud はカンファレンス中に、「クラウド インテリジェンス イン ワン」戦略を包括的にアップグレードし、大規模モデルの実装に関する 5 種類の顧客ニーズに対応するフルスタック サービス ソリューションを提供したことを発表しました。は「Qianfan AI ネイティブ アプリケーション開発ワークベンチ」をリリースし、エンタープライズ AI ネイティブ アプリケーションの実装を加速します。国内初の AI ネイティブ アプリケーション ストアと国内初の大型モデルのフルリンク エコロジー サポート システムをリリースし、パートナーのビジネス成長を促進し、共同でサポートします。豊かな大型モデルの産業エコシステムを構築し、共有します。
このカンファレンスで、Baidu Groupの執行副社長兼Baidu Intelligent Cloud Business GroupのプレジデントであるShen Dou氏は、人工知能とクラウドコンピューティングの緊密な統合が、企業がネイティブAIアプリケーションを迅速に実装するための鍵であると述べた。インテリジェントクラウドは、「クラウドとインテリジェンスの統合」というコンセプトを常に提唱し、実践してきました。

ここに画像の説明を挿入します

⭐顧客志向の大規模モデル導入のための5つの要件

現在、百度グループのすべてのアプリケーションとサービスは、「クラウド インテリジェンス インワン」テクノロジー アーキテクチャに基づいた百度スマート クラウド上で実行されています。また、Qianfan大型モデルプラットフォームをベースとしたBaidu Intelligent Cloudの「大型モデルスーパーファクトリー」では、大型モデル導入における5つの顧客ニーズに応え、以下の5つのベストなサービスソリューションを提供します。

  1. コンピューティング能力のみを必要とする顧客に対して、Qianfan プラットフォームは、非常に効率的でコスト効率の高い異種コンピューティング サービスを提供できます。顧客が最も懸念する大規模モデルのトレーニングプロセスにおいて、Qianfanプラットフォームは、分散並列トレーニング戦略とマイクロ秒レベルの相互接続機能により、効率的に大規模な計算能力の拡張を実現でき、万華規模のクラスタートレーニングの加速率は95に達します。 %; 事前の予防を通じて、タイムリーに問題を発見、特定し、解決することで、障害やその他の理由によるクラスターの無効な動作を最小限に抑え、有効なトレーニング時間の割合を増やします。Wanka クラスターの有効なトレーニング時間は 96 を超えています。 %、クラスターの効果的なコンピューティング能力を完全に解放し、顧客のコンピューティング能力と時間コストを大幅に削減します。さらに、Qianfan プラットフォームは、Kunlun Core、Ascend、Haiguang DCU、NVIDIA、Intel などの国内外の主流 AI チップとも互換性があるため、顧客は最小限の切り替えコストでコンピューティング能力の適応を完了できます。
    Face Wall Intelligence は Zhihu と協力して、Baidu Intelligent Cloud が提供する AI コンピューティング パワー クラスターに基づいて「Zhihaitu AI」大型モデルとマルチモーダル大型モデル Luca をトレーニングしました。キロカロリー クラスターでの有効トレーニング時間は次のように計算されます。モデルトレーニングの継続性を確保しながら、モデルトレーニング効果の効率的な収束を実現できます。さらに、Zhihu、TAL、Horizo​​n、NetEase Youdao などの企業も、Baidu Smart Cloud が提供する AI コンピューティング サービスを使用して、より安定して効率的かつ経済的な方法で大規模なクラスターのトレーニングと管理を実現しています。
  2. モデルレベルでは、既存の大規模モデルを直接呼び出したい顧客のために、Qianfanプラットフォームは国内外の42の主流大規模モデルを管理しており、企業顧客はWenxin大規模モデルを含むさまざまな大規模モデルのAPIを迅速に呼び出し、大規模モデル機能を取得できます。 。サードパーティの大規模モデルの場合、Qianfan プラットフォームでは、中国語の強化、パフォーマンスの強化、コンテキストの強化など、対象を絞った最適化も行われています。たとえば、Llama2 などの大型の外国モデルは、もともと英語の対話の方が得意でしたが、中国語の強化後は中国語でも同等のパフォーマンスを発揮しました。現在、Qianfan プラットフォームは 17,000 を超える顧客にサービスを提供しており、大規模なモデル コールの数は前週比 20% の割合で増加し続けています。
  3. 既存の大規模モデルに基づいて二次開発を実施したい顧客向けに、Qianfan プラットフォームは、大規模モデルの再トレーニング、微調整、評価、展開のための完全なライフサイクル ツール チェーンと業界最大の 41 個の高品質業界データ セットを提供します。 help お客様は、独自のビジネス シナリオに合わせてモデルの効果を迅速に最適化できます。現在、中国郵便貯蓄銀行、杜暁満、キングソフトオフィス、河北高速グループなどの業界の多くの主要顧客が、同社が提供するツールチェーンサービスを通じてビジネスニーズを満たす独自の大型モデルを開発しています。銭帆プラットフォーム。
  4. アプリケーション レベルでは、一部の企業は大規模なモデル サービスに基づいて AI ネイティブ アプリケーションを開発する必要がありますが、Qianfan プラットフォームで提供される一連の機能コンポーネントとフレームワークは、企業がアプリケーション開発を迅速に完了し、ユーザーと市場のニーズに柔軟に対応するのに役立ちます。
  5. 別の顧客グループは、ビジネス開発を強化するために、成熟した AI ネイティブ アプリケーション製品を直接かつ便利に購入したいと考えています。

ここに画像の説明を挿入します

⭐「Qianfan AI ネイティブ アプリケーション開発ワークベンチ」は、エンタープライズ AI ネイティブ アプリケーションの実装を加速します

機敏かつ効率的な AI ネイティブ アプリケーションの開発と運用と保守に対する企業のニーズに応え、AI ネイティブ アプリケーション開発の敷居を下げるために、百度スマート クラウドは、「Qianfan AI ネイティブ アプリケーション開発ワークベンチ」を開始しました。大規模モデル アプリケーションの一般的なパターン、ツールとプロセスがワークベンチに統合されているため、開発者は開発プロセスに不必要なエネルギーを費やすことなく自分のビジネスに集中できます。具体的には、Qianfan AI ネイティブ アプリケーション開発ワークベンチは、主にアプリケーション コンポーネントとアプリケーション フレームワークの 2 つのサービス層で構成されています。
アプリケーション コンポーネントサービスは、AI と基本的なクラウド コンポーネントという 2 つの主要なコンポーネント カテゴリで構成されており、基盤となるサービス機能をコンポーネント化してカプセル化し、各コンポーネントが特定の機能を実行できるようにします。「AI コンポーネント」には、質疑応答、思考連鎖 (CoT、思考連鎖) などの大規模な言語モデル コンポーネントだけでなく、ヴィンセント図や音声認識などのマルチモーダル コンポーネントが含まれ、「基本的なクラウド コンポーネント」にはベクトルが含まれます。データベース、オブジェクト ストレージ、その他の従来のクラウド サービス機能。
ここにある多くのコンポーネントの機能は、過去 10 年間にわたって Baidu によって徐々に蓄積されてきたため、大規模モデルのアプリケーションの開発が容易になりました。もちろん、これらのコンポーネントを直接使用する場合には、依然としていくつかのしきい値があり、一定の基盤が必要です。したがって、Baidu は、特定のシナリオのタスクを比較的完全に完了できるように、これらのコンポーネントを接続して組み合わせます、これがアプリケーション フレームワークです。

⭐一般的に使用される AI ネイティブ アプリケーション フレームワーク

現在、Qianfan プラットフォームで提供される Retrieval Enhanced Generation (RAG) と Agent (Agent) が、AI ネイティブ アプリケーション フレームワークとして一般的に使用されています。各フレームワークでは、Baidu Smart Cloud が提供する豊富なサンプル ルームを使用して、アジャイルかつ効率的な AI ネイティブ アプリケーション開発を実行できます。まず、RAG アプリケーション フレームワークを見てみましょう。

⭐検索拡張生成 (RAG)

検索拡張生成 (RAG) フレームワークは、企業の独自分野の知識をより効率的に利用し、大規模なモデルを利用して関連する質問に正確な回答を提供できます。専門知識の質問と回答の分野におけるネイティブ AI アプリケーションには必須です。コアコンピテンシーを準備します。
実際のビジネスでは、ユーザーが非常に専門的または非常に的を絞った質問をすることがよくあり、その答えはインターネット上ではなく、企業独自の文書データ内にあることは誰もが知っています。この場合、一般的な大規模言語モデルでは正確な答えを与えることができません。これは RAG の典型的なアプリケーション シナリオであり、大規模なモデルがこれらの特定の専門知識を学習して理解し、ユーザーに正確な答えを返すことができます。
カンファレンス会場では、RAG フレームワークに基づいて三一重工業向けの知識質問と回答アプリケーションを迅速に開発する方法に関する実践的なデモンストレーションも行われました。Qianfan AI ネイティブ アプリケーション ワークベンチでプレハブ RAG フレームワークを選択し、対応するパラメーター設定を実行するだけです。三一重工業の公式ウェブサイトでのインテリジェント顧客サービス アプリケーションの開発と公開を迅速に実現します。

このビデオでは、まずデモンストレーションの適用シナリオを紹介し、次に三一重工業の公式ウェブサイトでわずか数分でインテリジェントな顧客サービスの開発を実装し、最後に公式ウェブサイトで効果を実証します。
ここに画像の説明を挿入します

まずは実証の適用シナリオを見てみましょう. ここは三一重工業の公式ウェブサイトです. 三一重工業は掘削機をはじめとする様々な建設機械や設備を製造していることがわかります. ユーザーがこのホームページにアクセスすると, 彼はこれらの機器について相談したいのですが、性能パラメータ、操作、メンテナンスなどについて質問がある場合、ユーザーに適切なサービスを提供するには、これらの機器に精通したスタッフを見つける必要があります。しかし、三一重工の文書は内容が多く、たとえばこれは SY305H という掘削機の操作・保守マニュアルです。1 つの文書は 48 ページ、20,000 ワード以上あり、多くのパラメータや詳細が含まれています。従業員がこれらの内容を柔軟に把握し、ユーザーからの質問に答えることは依然として非常に困難です。Baidu の RAG ベースのアプリケーション フレームワークは、大規模なモデルを数分で作成できるため、モデルをすぐに習得してユーザーの質問に答えることができます。
この機能を実装する方法は実際には非常に簡単で、必要な手順は 3 つだけです。まず、Qianfanプラットフォームのコンソールに入り、ナレッジベースを構築し、名前を入力し、ナレッジベースを取得した後、SY305H操作およびメンテナンスマニュアルの文書をロードします。
ここに画像の説明を挿入します

次に、開発アプリケーションを入力し、[プラグイン オーケストレーション] をクリックします。構成では、作成したばかりのナレッジ ベースを関連付ける必要があります。関連付けが完了したら、[OK] をクリックしてオンラインにします。
ここに画像の説明を挿入します

このナレッジ インベントリはオンラインで提供できるようになりました。コードはここで自動的に生成されます。それをコピーして、三一重工業の公式 Web サイトのホームページのスクリプトに貼り付けることができます。ホームページに戻って更新してください。三一の小さなアイコンアシスタント、この掘削機に関する具体的な質問をすることができます。
ここに画像の説明を挿入します

アシスタントの回答は非常に簡潔で、何を使用する必要があり、何を使用すべきでないのか、使用しないとどのような問題が発生するのかがわかります。この部分の内容を文書から見つけ出し、アシスタントの回答と比較しました。アシスタントは簡潔であるだけでなく、非常に論理的であることがわかりました。この大規模なモデルが強力な言語理解と生成能力を備えているからこそ、したがって、現時点では、他にいくつかの質問をするだけで、内容を整理することができます。
20,000 ワードの記事と 48 ページのコンテンツをわずか数分でオンライン アシスタントに変えることができるのが、大型モデルの魅力です。

⭐エージェント

エージェント (Agent) は、現在の業界で人気のあるアプリケーション フレームワークであり、人間が与えたタスクを自動的に分解し、さまざまなコンポーネントを自動的に計画して呼び出して共同でタスクを完了すると同時に、タスクの完了結果に基づいてフィードバックを受け取り、改善を図ることができます。独自の能力。現在、エージェントフレームワークは産業、運輸などの分野で広く使用されています。
Qianfan AI ネイティブ アプリケーション開発ワークベンチが提供するエージェント フレームワークに基づいて、中天鋼鉄は、タスク指示の自動認識、分解、実行を実現するインテリジェントな「エンタープライズ スケジューリング センター」を作成しました。たとえば、鉄鋼生産が標準に達していないことが判明した場合、ユーザーは一度質問するだけで、大規模なモデルがプラットフォームによって管理されているさまざまなリソースと API を自動的に呼び出して、BI データの取得、サードパーティの根本原因の取得を完了できます。規格を満たしていない原因を分析などにより究明し、生産スケジュールをタイムリーに調整します。

⭐まとめ

大型モデルの時代が到来し、激動の時代が到来しました。潮流に乗ろうと競い合う人もいれば、波を追うのに忙しい人もいます。百度は、より効率的な知的インフラストラクチャ、より良く利用される船を使用して、堅実な船を構築することに取り組んでいます。 - 大規模モデル プラットフォーム、より豊富な業界ソリューション、AI ネイティブ アプリケーションの開花を阻止します。
三一重工業の実証事例と Qianfan プラットフォームへのアクセス プロセスの理解により、実際、わずか数ステップでアプリケーションを迅速に開発できます。これは企業にとってはコストの削減と効率の向上を意味します。技術者にとっては、Qianfan は素晴らしい モデル プラットフォームの豊富なツール セットにより、迅速な開発が可能になり、より創造的なことに時間とエネルギーを集中することもできます。

おすすめ

転載: blog.csdn.net/weixin_50843918/article/details/133914713
おすすめ