ビッグモデルの時代、「誰でもAIができる」Baidu開発者プラットフォームとはどのようなものでしょうか?

導入 

大規模モデルの時代の開発者プラットフォームは、ネイティブ AI 機能を提供するだけでなく、エコシステムの作成と商用化のクローズドループ機能も備えている必要があります。

全文は6115ワード、推定読了時間は16分です。

「スピリチュアルな世界」というと、人々は旅行したことのある景勝地を頭の中で思い浮かべることが多いです。しかし、一般的な大型モデルの「知性の出現」という文脈では、ここで AI の世界を探索する準備ができている開発者に機会を提供できる「精神的領域」プラットフォームはどのようなものになるでしょうか?

この質問に答えるのは難しいですが、結局のところ、開発者プラットフォームの運用には、製品の磨き上げ、ルールの確立、継続的な運用などの複数の側面が関係します。新しい時代の始まりには、さらに予測不可能な変数が生じるはずです。

しかし現時点では、独自の答えを出そうとしている先駆者もいます。例えば、中国で初めて「Wen Xin Yi Yan」をローンチしたBaiduも、今年9月には独自の開発者プラットフォーム「Lingjing Matrix」(以下、「Lingjing」)をいち早くローンチした。

9 月の Spirit Realm Matrix のパブリック ベータ版の開始以来、受け取ったアプリケーションの総数は約 27,000 であることがわかりました。このうち個人開発者の割合は増加傾向にあり、現在では3割程度となっている。Lingjing Matrix の違いは、開発機能の提供に重点を置いているプラ​​ットフォームであるだけでなく、開発者がプラットフォームを通じて実際に収益を得ることができることを期待して、開発者向けの一連のトラフィック収益化チャネルも設計していることです。

非常に最先端の探索機構であり、興味津々ですが、霊界マトリックスはどのような考えで立ち上げ、設計されたのでしょうか?

最新の「Baidu Search Innovation Competition」の開催中の11月15日の午後、私たちは「霊界」に関するさまざまな質問を抱えてBaidu Science and Technology Parkを訪れ、Baiduの責任者である張瑞興氏と2時間話し合いました。霊界マトリックスプラットフォームへのアクセス。

1. 霊界の誕生 大型模型の成功が戦況の鍵

「開発者に力を与えるために、AI アプリケーションを開発するための低コストのプラットフォームを構築すべきでしょうか。それとも、開発者が大規模モデルに直接アクセスできるように支援し、大規模モデルを通じてさまざまな企業に力を与えるべきでしょうか? どちらの方向を選択すべきでしょうか? 私たちは長い間、多くの経験をしてきました。霊界がなぜ生まれたのかという質問に、張瑞星さんは率直に答えた。

今年の初め、新しい大型モデルの戦場では、ほとんどの人が国内のMiaoya Camera、海外のMidjourneyなどのアプリケーションを選択しました。しかし、Baidu は自社製品を全面的に再構築することに加えて、開発者のコ​​スト削減を支援する方法についても考えています。

これは非常に重要な判断です。大きな模型は強力な頭脳ですが、より多くの手と足を必要とします。したがって、今年の初めに誰もが大型モデルに注目していたとき、Baidu は大型モデルにより多くの機能サポートを提供する方法を検討し始めました。

開発者プラットフォームがオプションになりました。Midjourney のようなアプリケーションを作成した場合、成功するのは個人です。開発者プラットフォームとして、私たちが達成するのは大規模なモデルとエコシステムです。より多くの開発者がここに来て、より多くの機能を開発すれば、大手モデルが恩恵を受けることになります。BaiduのWenxin大型モデルは、新時代のAIの戦いにさらに勝利します。

この判断も、大型機種をご利用の多くのお客様との「雑談」を通じて判断させていただきました。

「当時、私たちは多くの開発者や企業ともコミュニケーションをとりましたが、大規模なモデルを使用する場合、特定のシナリオにおいて依然としていくつかの問題点があり、それらを解決するためのプラグインなどの製品が必要であることがわかりました」と Zhang Ruixing 氏は述べています。

したがって、Lingjing の位置付けは、Wenxin の大型モデルの脳がより多くの手と足を持てるようにして、Wenxin のサービス能力を強化することです。

2. コンセプトを捨て、プラグインもエージェントも精神的な領域

大規模モデル業界では反復が非常に速く、ボット、プラグイン、エージェントなどの多くの概念が市場に登場しています。しかし、大型モデルが日々変化する時代においては、こうした概念に囚われることはあまり意味がありません。

「開発者が十分な低コストで大規模なモデルのベースに接続できるメカニズムが必要です。このメカニズムはプラグイン、エージェント、ある種の API、またはその他の何かと呼ばれますか? すべては単なる概念です。テクノロジーの進化と市場の発展により、それらは最終的には徐々に標準化され、パラダイムに統一されるでしょう。」と Zhang Ruixing 氏は信じています。

しかし、もう 1 つの疑問は、Agent はむしろ未来のパラダイムに近いものであるため、プラグインは重要ではないのかということです。エージェントとの関係は何ですか?

Zhang Ruixing 氏の目では、エージェントは将来の主流のアクセス方法になる可能性があり、エージェント自体にはいくつかの主要な機能が含まれています。

「エージェントは、まず要件を説明する自然言語を理解する必要があります。2 つ目は、理解に基づいてユーザーの行動やタスクに対する効果的な計画を立てることです。同時に、ユーザーとの対話情報の長期記憶も必要です。」 Zhang 氏Ruixing 氏はさらに、このプロセスでユーザーのニーズを満たすために、エージェントは実際にさまざまなツールを呼び出す必要があると説明しました。

したがって、プラグインはエージェントの基礎となり、エージェントが呼び出す必要がある多数のツールの基礎となる可能性があります。

たとえば、旅行旅程計画エージェントを使用すると、ユーザーは個人の習慣に基づいて旅行旅程を計画するパーソナル アシスタントを迅速に開発できます。

ただし、エージェント自体は多数のツールを呼び出す必要があります。つまり、天気を問い合わせたり、飛行機や電車の時刻表、フライト情報、窓際に座りたいかどうかなどの個人的な好みを問い合わせる必要がある場合、目的地の都市の興味深い観光スポットを問い合わせる必要もあります。これを使用する場合、エージェントは多くのプラグイン ツールを呼び出して、ユーザーの個人的なニーズを組み合わせて満たします。

この観点から見ると、さまざまなプラグインがエージェントをサポートするベースとなります。

「プラグインが現在実行していることは、多数のツールです。たとえば、旅行インテリジェント旅程計画エージェントは、ユーザーとの対話後にチケットの予約を直接支援する場合があります。このアクションを完了するには、チケットの予約を調整する必要があります。」 「ツール、つまり、プラグインが現在何をしているのかを示します。プラグインは将来、エージェントの重要なサポートになるでしょう。」と Zhang Ruixing 氏は言いました。

彼はまた、将来の大規模モデル、エージェント、プラグインの関係を説明する興味深い比喩を述べました。「エージェントは小脳であり、大規模モデルは脳である可能性があります。将来的には、各企業の大小の頭脳が統合されるかもしれません」 」

3. なぜそれが霊的な領域でなければならないのですか?

現在、多くの大規模モデル会社が開発者プラットフォームを立ち上げていますが、大規模モデル時代の開発者プラットフォームになるには、技術サポートだけでなく、ユーザーのニーズを理解し、エコシステムを構築し、クローズドループ機能を商用化する能力も必要です。 。

Lingjing の誕生は、百度の大規模モデル パターンに関する先進的な研究と判断から始まり、過去の技術、製品、エコロジー、商品化システム全体の蓄積とも切り離すことができません。

霊界マトリックスプラットフォームの実際のプロジェクト設立時期は7月です。プロジェクトの設立からオンラインテスト、9月の外部リリースまで、Lingjingには約2か月しかありません。

Zhang Ruixing 氏は、一秒を争うような当時のチームの激しいペースを思い出し、「30 日も経たないうちに、8 月中旬から下旬に内部ベータ (招待ベータ) バージョンがリリースされました。9 月初旬に、正式にリリースされました。」アライアンスサミットでのパブリックベータ版。」

Lightspeed での「Lingjing」開発者プラットフォームの立ち上げは、チームの全力の努力に加えて、Baidu の過去の長期的な蓄積とも大きく関係しています。これは、中国の大規模モデル会社の多くが備えていないものです。

まず第一に、Baidu は強力な開発者エコシステムを蓄積してきました。元のウェブマスターであれ、その後のミニプログラムであれ、これら数百万人のウェブマスターと 30 万から 40 万人の小規模開発者は、Baidu の当然の利点です。

市場の多くの企業は開発者エコシステムの構築を望んでいますが、このレベルの経験は蓄積されていません。開発者やBサイドエコシステムなしでプラットフォームを構築した場合、企業が強力なレイアウト能力を持っていない限り、プラットフォームを構築したとしても収益は非常に低くなります。

さらに、開発エコシステムを備えた大手モデル プレーヤーと比較して、Baidu は豊富な「トラフィック シナリオ」も備えています。

これにより、市場における Lingjing のポジショニングがより差別化されます。Lingjing は、単なる開発プラットフォームではなく、「開発 + 運用 + 商業化」をカバーする統合エンパワーメント プラットフォームです。

対照的に、国内外の多くのプラグイン開発者は、「エコシステムなし、トラフィック シナリオなし」というジレンマに直面しています。たとえば、OpenAI エコシステムでは、金融分野のプラグイン開発者はプラグインが完成したと述べましたが、ChatGPT で財務に関する質問をする人はほとんどいなかったため、プラグインの呼び出しはほとんどなく、利益は非常にわずかでした。トラフィック分散のない開発者プラットフォームは効果がなくなる可能性があります。

Zhang Ruixing氏は、「位置付けに『開発』という言葉だけを書いたらどうだろうか。霊京には開発、運用、商業化が含まれるが、初期段階では間違いなく開発が最も重要だからだ」と説明した。

同氏は、Baidu が以前に配信シナリオを部分的に公開しており、第 4 四半期には、Baidu Search と Wenxinyiyan という 2 つの主要な配信シナリオを完全に公開する予定であることを明らかにしました。 Lingjing はすべて Access 内にあります。したがって、開発者は Lingjing 上で開発できるだけでなく、よりシーンに適したトラフィックの流入が可能になることが間もなくわかります。今年の第 4 四半期か来年の第 1 四半期には、 Lingjing は商用化機能を展開し、一部のプラグイン開発者が対応するシナリオでトラフィックを収益化できるようにします。」

では、相手にもこの2つの利点がある場合、霊的領域のサポートは何でしょうか?

答えは、大型モデル自体の機能にあります。中国では、百度の大型モデルへの投資は非常に長期かつ巨額であり、その成果も国際基準に追いつきつつあります。

4. 楽しみの悪魔的な詳細

多くの場合、機能の完成度や使いやすさが、初期段階で製品の成否を決定します。

では、初期の開発モデルに関して、Lingjing と ChatGPT プラグインの違いは何でしょうか? 張瑞興のナレーションを通して、私たちは悪魔がしばしば細部に隠れていることを感じます。

まず、Lingjing は最新のビジュアル開発およびオーケストレーション モデルを採用しており、ドラッグ アンド ドロップによって Langchain などの中間プラットフォームをある程度排除し、大規模モデル アプリケーションの開発コストを削減できます。Baidu Lingjing Matrix が実際にこの比較的先進的な手法を採用したのは、OpenAI よりも早い 7 月と 8 月であったことがわかります。

第二に、アクセスレベルでは、スピリチュアルな領域はさまざまな方法をサポートしています。ChatGPT と同様に、より多くの API アクセスをサポートしますが、Lingjing は、ローカル アップロード、データベース、API など、より多くの種類のデータ アクセスをサポートし、すべての機能ベースのアクセスをカバーします。さらに、アプリケーションへのアクセスもスピリチュアルな領域の大きな特徴です。Ctrip などの強力な機能を持つ一部の開発者は、同様のスマート アプリケーションを作成するために陵京に来ようとしていますが、将来的には、このスマート アプリケーションを大規模モデルに接続することもできます。「私たちは 3 つのモードすべてへのアクセスをサポートしているため、プラグインよりもアクセス方法が豊富です。」と Zhang Ruixing 氏は述べています。

第三に、Lingjing のトップレベルの設計では、プラグインの配布が統合されたマルチターミナル モデルに設計されています。なお、このモデルは第4四半期に完全導入される予定だ。

「いわゆるワンインワンのマルチターミナル設計は、Baidu のトラフィック シナリオの特性に基づいており、Web 検索用のさまざまなモバイル APP や PC ブラウザと互換性があるように設計されています。」と Zhang Ruixing 氏は述べました。ワンインワンのマルチターミナル配信機能、将来的には精神的な領域 プラグインは元のアプリ、さらには独自のミニプログラムにネイティブに埋め込むことができます。これは優れた基盤であり、ChatGPT-Plugin ではできないものです成し遂げる。

多くの差別化された機能を備えた Lingjing は現在、法律、感情、オフィス作成、製品評価などに加えて、比較的幅広い分野をカバーしており、多数のプラグインが開発、提供されています。現在、Lingjing は依然として大規模モデル アプリケーションにとって最も重要なシナリオであるため、オフィス作成プラグインは主に Lingjing で使用されています。

また、以前の 2 つの Lingjing アプリケーションである Legal Bot と Travel Bot が開発者に長い間好評を得ていることにも気付きました。

これら 2 種類のボットの作成方法からは、スピリチュアル マトリックスの動作の詳細もわかります。

まず、百度はこれら 2 つの業界のために特別チームを設立しました。

合法ボットなど。Baidu の法務部門は、多忙なスケジュールを利用して、ボットを修正し、回答の正確さを逐語的に評価するために多くの専門弁護士を派遣しました。「私たちは製品にあまり投資していないように見えますが、チーム全体が合計され、それぞれの小さな方向への投資は基本的に数十人程度で、これには戦略チーム、評価チーム、関連する専門チームが含まれます。」 Zhang 氏立ち上がりの紹介。

Travel Bot は、Lingjing チームの貢献だけでなく、Ctrip チームと Baidu との強力な協力の成果でもあり、「これは、多額の投資と協力を行った兄弟の非常に緊密なチームに相当します。」私たちがこれを行うのです。」 張瑞星を補充します。

さらに、ドメインの調整も大規模モデルにとってホットなトピックです。

Zhang Ruixing 氏は、法務ボットのトレーニングのプロセスにおける自身の経験を共有し、「大規模なモデルのトレーニングの前処理と事前トレーニングのプロセスでは、戦略的な調整を繰り返し行う必要があります。たとえば、同じ質問にこう答えたり、あのように答えたりすると、 「どちらが重要ですか? どちらが正しいか、それとも良いかについては、肯定的なフィードバックが必要です。このプロセスにおいて、Lingjing には大規模モデルのトレーニングを支援する多数の評価チームとサンプル生成チームがあります。」

ポイントは2つあり、1つは、チーム全体が「わからない」から「わかる」に至る過程で、実は社内外の専門家とのコミュニケーションを頻繁に行う必要があるということです。「私たちは市場で議論できるすべてのことについて話し合いました。法務チームは製品チームにトレーニングも提供します。チームは専門家も紹介し、データ注釈プロセスでは法的な背景を持つ人材を採用しました。」と彼は私たちに語った。 。

さらに、専門組織と協力することで、製品の有効性を大幅に向上させることもできます。Lingjing プラットフォームの法的コンテンツは、中国司法ビッグデータ研究院からもサポートを受けていることがわかりました。

「深海エリアに入ると、この垂直領域に入ると、戦略とモデルの有効性、そして『フランス語』全体の理解が大きなレベルに達するでしょう。」と張瑞星氏は結論付けました。垂直分野に携わる。

5. 未来の霊的領域

「AIは誰でも使える」というのがLingjingのコンセプトです。これは長期的な目標であり、達成するには継続的な努力が必要です。

来年も、Lingjing は 3 つの主要な方向に引き続き注力すると理解しています。

まず第一に、Lingjing プラットフォームは引き続きコストを削減し、これが Lingjing の核心であり、業界のトレンドでもあります。AI 時代の開発者は、従来の意味での専門的な研究開発能力を持つ実践者だけでなく、AI を試してみたいと願う一般人も増えています。これを実現するには、開発者のコ​​ストを削減することが最優先事項となります。

エージェント開発パラダイムの出現により、この問題は好転しました。

エージェント開発モデルでは、コード、開発 API、およびプロンプトを通じて機能を作成すると、コスト削減の大きな余地がもたらされます。

「コストはどの程度削減されるでしょうか? 将来的には、Lingjing プラットフォーム全体がエージェントになる可能性があります。ユーザーは、「何かを作成したい」または「データベースを接続したい」と入力するだけで済みます。これは私たちにとって明確な道です」と Zhang Ruixing 氏は言いました。

そしてこちらも新品のフライホイールです。このモデルにより、開発の敷居が下がり、より多くの開発者が集まり、開発能力のある人がより良いものを開発できるようになります。

Zhang Ruixing 氏は、Lingjing がコストを削減し続けるためのいくつかの計画についても詳しく説明しました。

最も直接的な方法は、開発者の開発プロセスを圧縮し、開発者がプロ​​セスをプロンプトに変換し、対応するエージェントを準備するのに大規模なモデルを直接支援させることです。

さらに、スピリット領域は開発者に多くのリソースも提供します。「Lingjing は、より多くのコンピューティング能力とより多くの無料トークンをすべての人に提供します。さらに、Lingjing は経済的な権限やサポートも提供します。たとえば、サーバー レベル、クラウド サーバーなどのソフトウェアおよびハードウェアの状態で、次のようなことができます。多くの個人開発者や企業開発者に無料で公開してください。」と Zhang Ruixing 氏は付け加えました。

2 番目の重要なアプローチには、クローズドループ ビジネスが含まれます。言い換えれば、Lingjing は開発者に十分なビジネス能力を与えることにもなる. 「私たちは、この路線が依然として Baidu の差別化の中心的な利点であると信じています。私たちは空虚な言葉を話すだけでなく、開発者に実際に利益をもたらすことができます。」と Zhang Ruixing 氏は強調しました。開発者は何か良いものを作ったので、Lingjing は彼がそれを立ち上げるのを手伝いたいと思っています。」

その中で、Lingjing は、開発者が実際にトラフィックとユーザーを獲得できるよう支援する一方で、さまざまな商用化の権限も提供します。一方、Cサイドの需要が不足している開発者のために、Lingjingは「D2C」および「D2D」モデルも作成する予定です。「他の開発者は、あなたが開発した良いものを購入したり、直接使用したりできます。」とZhang Ruixing氏は述べました。開発者がプラットフォームの料金を支払ってプレミアム製品を作成できる「D2P」ビジネスモデルが開始される可能性があります。

もちろん、ユーザー エクスペリエンスを確保するために、Lingjing ではプラグインのオンライン レビューに厳しい要件を設けています。特定のプラグインのリリースは、Wenxinyiyan や Baidu Search などの製品を通じてユーザーと対話する必要があることを意味します。この場合、精度、トリガー精度、応答品質に対してより高い要件が求められます。この目的のために、Lingjing チームはユーザーに悪い体験を与えないよう、厳格なオンライン評価基準を設けています。

もちろん、霊的領域を磨き続ける道には、さまざまな困難も伴います。最も直接的には、モデルとクエリの調整、そして最後にアクションの実行です。

エージェントの開発パラダイムでは、Web ページ配布の元のロジックはもはや適用できません - 将来的には、あらゆる Web ページまたは Web サイトが小さなエージェントとして定義される可能性があり、将来の検索はさまざまなタイプのエージェントへの呼び出しになるでしょう。

たとえば、Web サイト エージェント、アプリ エージェント、データ エージェントはすべて異なるタイプのエージェントです。したがって、このプロセスをインテリジェント化および自動化し、エージェントを正確に特定し、呼び出し、配信する効果を実現するには、製品を最適化するだけでなく、プロセスの B と C を統合する戦略的フライホイールとデータ フライホイールを形成する必要があります。

これは、大規模なモデルに強力な判断能力と認識能力があり、エージェントと対話する能力がある場合にのみ可能です。これは、Lingjing のフォローアップの中核となる方向性でもあり、検索 AGI + ユニバーサル エージェントの作成です。

これは明らかに簡単な仕事ではありませんが、Spirit Realm Matrix では、より大きなビジョンがまだ途中にあります。

Baidu のビジョンでは、Lingjing は将来 GPT に似たストアも構築する予定です。「しかし、モバイル時代の App Store とは異なり、Lingjing は開発者に真に適した構築パラダイムを構築することができ、それによって同様の分野で新しいものを生み出すことができます。」 Zhang Ruixing 氏の見解では、このようなプラットフォームを構築することが、クリエイターの想像力をさらに刺激し、エージェント エコシステム全体をより繁栄させる唯一の方法です。

- 終わり -

推奨読書

数十万の QPS、Baidu のホット イベント検索の安定性保証の実践

Baidu検索の兆規模特徴量計算システムの実践

Python スクリプトによる OC コード再構築の実践をサポート (3): データ パスにアクセスするためのデータ項目使用モジュールの適応

Baidu 検索インテリジェント コンピューティング能力の制御と割り当て方法

UBC SDK ログ レベルの繰り返し率の最適化の実践

Spring Boot 3.2.0 が正式リリース、 Didi 史上最も深刻なサービス障害、原因は基盤ソフトウェアか、それとも「コスト削減と笑いの増大」か? プログラマーらがETC残高を改ざんし年間260万元以上を横領 Google従業員が離職後偉人を批判 Flutterプロジェクトに深く関与しHTML関連の標準策定に関与 Microsoft Copilot Web AIが正式にスタート12 月 1 日、2023 年に中国版 PHP 8.3 GA Firefox をサポート Rust Web フレームワーク Rocket が高速化して v0.5 をリリース: 非同期、SSE、WebSocket などをサポート Loongson 3A6000 デスクトップ プロセッサが正式リリース、国産の光! Broadcom が VMware の買収成功を発表
{{名前}}
{{名前}}

рекомендация

отmy.oschina.net/u/4939618/blog/10305571