大規模モデルをベースにしたBaiduのコード作成アシスタント「Comate」は本当に使いやすいのでしょうか?

青い文字をクリックしてフォローしてください

フォローしてスターを付ける

決して迷わない

コンピュータビジョン研究所

9a91c68967d66d097fe8835e0fdb02e2.gif

9ff21a29fdbbcfd0e892797144ba03c1.gif

公的IDコンピュータビジョン研究所

学習会参加方法はホームページのQRコードを読み取ってください

コンピュータビジョン研究所コラム

コンピュータビジョン研究所のコラム

6月6日、文新大規模モデル技術交換会議(成都)で、百度スマートクラウドは「Comate」コードアシスタントを発表し、招待テストを正式に開始した。Wenxin のビッグ モデルの理解と推論能力の助けを借りて、「Comate」は高速なコード補完、自然言語コードの推奨、自動コード エラー発見を実現し、開発者の研究開発効率を包括的に向上させることができます。将来的には、開発者はプラグインやその他の形式を通じて、主流の開発ソフトウェアで「Comate」コード アシスタントを使用できるようになります。市場にはすでに多くのコードアシスタントツールがありますが、Baidu が目立つでしょうか?

423df4887a1090c99390e926edbbbdc7.gif

01

バックグラウンド

2021 年 6 月には、Baidu Smart Cloud は将来の大規模モデルのトレーニング タスクに対応するため、新しい高性能 GPU クラスターの構築計画を開始し、NVIDIA と協力して、IB ネットワーク アーキテクチャの設計を完了しました。 10,000 枚以上のカード クラスタ内のノード 室内の各 GPU カードは IB ネットワークを介して接続されており、クラスタ構築は 2022 年 4 月に完了し、単一クラスタの EFLOPS レベルのコンピューティング能力を提供します。

2023 年 3 月、Wenxin Yiyan がこの高性能クラスター上に誕生し、新しい機能を繰り返し開発しました。現在、このクラスターのサイズはまだ拡大中です。NVIDIA 中国、ソリューションおよびエンジニアリング担当ゼネラルマネージャー、Lai Junjie 博士: 高速 IB ネットワークで相互接続された GPU クラスターは、大型モデルの時代の重要なインフラストラクチャです。NVIDIA と Baidu Smart Cloud が共同構築した国内クラウド コンピューティング市場最大の高性能 GPU/IB クラスターは、大型モデル分野における Baidu の躍進を加速します。

a02d8b373b0e96e066553f72832c857e.png

5566fe691ed5a838732bdd878cbfcfaf.png

  • 大規模モデルのライフサイクル全体をカバー - より包括的かつ包括的に

データのラベル付け、モデルのトレーニングと評価、推論サービス、アプリケーション統合のための包括的な機能サービスを提供します。

  • トレーニングと推論のパフォーマンスが大幅に向上 - より効率的かつ効率的に

MLPerfリストの学習性能は世界トップクラスで、1000億モデルの分散並列学習の高速化能力と計算能力の利用率が大幅に向上

  • 迅速なアプリケーション オーケストレーションとプラグイン統合 - よりオープンに

Baidu Wenxin の大規模モデルとサードパーティの大規模モデルをプリセットし、プラグインとアプリケーションの柔軟な配置をサポートし、大規模モデルを複数のシナリオに適用できるように支援します。

  • 組み込みの機密ワードフィルタリング - より安全で安全

完璧な認証とフロー制御セキュリティメカニズム、組み込みの機密ワードフィルタリング、機械レビューと人間によるレビューの二重保証

内蔵Wenxin大型モデルベース

  • テクノロジーのリーダーシップ

    知識を強化した大規模モデル、統合パラダイムが複数種類の下流タスクをサポート

    高度な並列戦略は、大規模なモデルのトレーニング、圧縮、展開をサポートします

    制御可能で信頼性の高い言語理解および生成機能

  • 完全なシーンをカバー

    対話の対話、自由な質疑応答、コピーライティングなどの機能をサポートします。

    エネルギー、金融、航空宇宙、産業、メディアなどの分野をカバー

  • 敷居が低くて使いやすい

    サービスを呼び出すための 1 行のコード

    ワンクリックで自動モデル微調整

    少量のデータでマルチシナリオ AI アプリケーションの実装を完了

  • 本物で着陸可能

    エンタープライズレベルのワンストップカスタマーサービスを提供

    チップ + プラットフォーム + モデル + アプリケーションの 4 層アーキテクチャを通過する

    複数のパートナーと協力して、エンドツーエンドのアプリケーションのランディングを実現します

02

大規模モデル コード アシスタント

デジタルトランスフォーメーションの需要の高まりに伴い、企業におけるAIの応用例はますます増えており、AI開発の敷居の高さ、複雑で多様なアプリケーションシナリオ、シーンアノテーションデータへの依存などが、AIの大規模導入における課題となっている。大規模モデルのトレーニング 人工知能の出現は、新たな機会と希望をもたらしました。

政府や企業が人工知能産業の発展を促進するための重要な出発点として、大規模モデルは、認識、理解、意思決定、そして世代。プログラマーが、反復的で単純かつ些細なタスクの完了を簡単かつ正確に支援できるコード アシスタントを備えているとしたら、それはもはや夢ではありません。

現在、この必須ツールを使用する必要がある開発者がますます増えています。現在主流の AI インテリジェント プログラミング コード アシスタントには、Github CopilotX、Codeium、Tabnine、Replit Ghostwriter、Amazon CodeWhisperer などがあります。

  • Github CopilotX

5976ecfab7f28ec50f0094a95e6f0b1b.jpeg

Copilot Xは2021年にリリースされたCopilotのアップグレード版で、GPT-4に接続され、チャットや音声などの機能が追加されています。Copilot Xでは「口を動かす」だけでコードを書くことができます, 私はあなたのためにテスト ケースも書きました。理解できないコード スニペットを説明したり、直接デバッグできるようにしたりすることもできます。プログラマにとっては、単なる思慮深い小さなアシスタントです。

7a7b4d3f04a6ccfbc0e821f22629c0d6.jpeg

OpenAI の GPT-4 モデルのリリースに伴い、GitHub は GitHub Copilot X の新バージョンをリリースしました。Copilot X の AI モデルは最新の OpenAI GPT-4 を使用します。GitHub Copilot X は開発者エクスペリエンスの向上に取り組んでおり、チャットと音声インターフェイスを提供し、プル リクエストをサポートし、ドキュメントの質問に回答し、GPT-4 を通じてよりパーソナライズされた開発者エクスペリエンスを可能にします。GitHub Copilot X を使用すると、コードの目的を説明したり、バグが発生した場合には Copilot X に修正を試みさせたり、単体テストを生成したりすることもできます。

  • リプリットゴーストライター

d0ee0404247b2fe3e7946eb50d69323a.png

Replit Ghostwriter は、開発者がコードを迅速に作成、生成、変換、解釈できるようにする人工知能ベースのコード支援ツールであり、エディター内でオープン ソース コードを検索してインポートする機能を提供します。Replit は、Python、JavaScript、Ruby などの複数のプログラミング言語をサポートするオンライン統合開発環境 (IDE) で、開発者はブラウザーでコードを作成、実行、共有できます。また、Replit は複数人でのコラボレーション、バージョン管理、クラウド展開などの機能も提供しており、開発者はアプリケーションを簡単に構築、リリースできます。Replit AI Ghostwriter は、OpenAI の GPT-4 モデルを活用して開発者に AI を活用したコーディング支援ツールを提供する Replit の新機能です。

しかし、現在、Baidu Smart Cloud は、Wenxin モデルに基づいた新世代のコーディング支援ツール、コード アシスタント Comate! を作成しました。

8859597c9c21fd3703e2834b628a3e31.png

エンジニアの開発プロセス中、Comate は開発中のコンテキストとコメントの組み合わせコードを通じて宣言された関数名を読み取ることでコードを予測できます。提案を表示したり、提案されたコードを手動で編集したりすることができますが、重複したコードは自動的に埋められます。

動作原理は、グローバル GitHub リポジトリ上のヘッド オープン ソース コードを読み取り、データを収集してそれに関連する最適なコードを見つけようとし、返されたデータを通じて継続的にトレーニングして推奨精度を向上させることです。コア機能は、単一行の推奨事項、複数行の推奨事項、および自然言語変換コードに反映されます。

単一行の推奨事項

93f792d05e68da0834d8e96c1d2f9036.gif

複数行の推奨事項

f4c28c0212ccbf1cc5db64fc4463f7c2.gif

自然言語トランスコーディング

3614c9745a75325202f66044084ee5e7.gif

多くの社内テストを経て、Comate が提案したコードのうち 30% ~ 50% が開発者に採用され、正式な新しいコードの 10% 以上を占め、さまざまな製品開発に適用されるものが増えています。 。Comate は主流の IDE フレームワークをサポートしており、現在 30 以上の言語、特に C/C++、Python、Java、Go、PHP、JavaScript およびその他の主流言語をカバーしています。

© ジ・エンド 

転載の際はこちらの公式アカウントにご連絡の上、許可を得てください。

bf1e52f8d93c6c68612cbc566e761e87.gif

コンピュータビジョン研究所研究会は皆様のご参加をお待ちしております!

だいたい

コンピュータビジョン研究所

コンピュータビジョン研究所は主にディープラーニングの分野に携わっており、主にターゲット検出、ターゲット追跡、画像セグメンテーションなどの研究方向に取り組んでいます。研究機関では常に最新の論文のアルゴリズムフレームワークを共有し、「研究」と「実践」に重点を置いたプラットフォームとなっています。後半では、該当分野の実践プロセスを共有し、誰もが理論から脱却する現場をリアルに体験し、プログラミングと頭脳思考を愛する習慣を養います。

1c0fd48728e666376a727de3cc6d0ff1.png

6cdf53bbc31d5e2bb85dd5ac168c8318.png

b1a540dea9006c2ec42758514a960766.png

3657bfcd5e8f3e73a53f2c5bf99bf995.png

63a30564dde0e5cddcd851d9e0c34cc8.png

すぐに協力・相談するには「原文を読む」をクリックしてください

おすすめ

転載: blog.csdn.net/gzq0723/article/details/131118364