Google が小規模で Gemini のテストを開始したとの噂があります。Gemini は GPT-4 をトレーニングする場合の 5 倍の計算能力を備えており、マルチモーダル機能が大幅に向上しています。

        最新のニュースは、直接の知識を持つ 3 人の関係者によると、Google が少数の企業に Gemini ソフトウェアの初期バージョンの使用を許可したということです。これは、Google がそれを消費者向けサービスに組み込んで、企業向けに販売しようとしていることを意味します。同社のクラウドコンピューティングサービス。

        今年 5 月の Google I/O カンファレンスで、ピチャイ氏は GPT-4 のベンチマークとなる大規模モデルである PaLM 2 を発表しましたが、同時に Google の研究の焦点がマルチモーダルで効率的なモデルである Gemini に移っているとも述べました。ツール。

        Gemini の開発をより迅速に行うため、Google は今年 4 月に社内の 2 つの人工知能研究所、Google Brain と DeepMind を合併しました。この共同プロジェクトは、2 つの研究所の研究者チームで構成され、Gemini の共同プロジェクトを主導します。

        次の数か月で、Gemini の謎が少しずつ明らかになりました: このモデルは Google Brain と DeepMind の合併後に開発され、GPT-4 のような数兆個のパラメータを持つことは一般的に知られています。Gemini はトレーニング中に訓練されています以前のモデルでは見られなかったマルチモーダル機能を実証し、微調整してセキュリティを厳密にテストした後、Google はさまざまな製品、アプリケーション、デバイスへの展開を確実にするために、さまざまなサイズと機能の Gemini バージョンも提供する予定です。

        最新のニュースは、直接の知識を持つ 3 人の関係者によると、Google が少数の企業に Gemini ソフトウェアの初期バージョンの使用を許可したということです。これは、Google がそれを消費者向けサービスに組み込んで、企業向けに販売しようとしていることを意味します。同社のクラウドコンピューティングサービス。


GPT-4を超えることはできるでしょうか?

        最近、セミアナリシスのアナリストであるディラン・パテル氏とダニエル・ニッシュボール氏がジェミニについてさらに多くの事実を明らかにしており、ディラン・パテル氏は今年 7 月 11 日に GPT-4 のアーキテクチャを公開しました。

写真

        Dylan Patel と Daniel Nishball は、第 1 世代の Gemini は TPUv4 でトレーニングされるべきであり、これらのポッドには最大数のチップ (4096 チップ) が統合されておらず、チップの信頼性と信頼性を確保するためにより少ない数のチップが使用されていることを明らかにしました。交換可能。14 個すべてのポッドが適切なマスク フィールド使用率 (MFU) で約 100 日間使用された場合、Gemini をトレーニングするためのハードウェア FLOPS は 1e26 を超えます。

        ただし、Gemini は、GPT-4 のトレーニングに使用される計算能力の 5 倍である、最大 ~1e26 FLOPS の計算能力を持つ新しい TPUv5 ポッドでトレーニングを開始しました。

        さらに、Gemini の学習データベースは Youtube のビデオ字幕 93 億 6,000 万分であり、データセットの総サイズは GPT-4 の約 2 倍です。

        Gemini は一連の大規模な言語モデルで構成されており、MOE アーキテクチャと投機的サンプリング テクノロジを使用して、小さなモデルを通じて事前にトークンを生成し、それを評価のために大規模なモデルに転送することで、モデルの全体的な推論速度が向上します。

        機能的には、Gemini は、チャットボットからテキストの要約、またはユーザーが読みたい内容の説明に基づいた生のテキスト (電子メールの下書き、歌詞、ニュース記事など) の生成に至るまで、あらゆるものをサポートしています。さらに、Gemini は、ソフトウェア エンジニアがコードを記述し、ユーザーの要件に基づいてオリジナルのイメージを生成するのを支援します。

        The Information の以前のレポートによると、Google は Gemini によってソフトウェア開発者のコ​​ード生成機能が大幅に向上し、Microsoft の GitHub Copilot コード アシスタントに追いつくことを期待しているとのことです。

        Googleの従業員らはまた、完成したグラフの意味をモデルに解釈させるなどのグラフ分析などの機能を実行するためにGeminiを使用することや、テキストや音声コマンドを使用してWebブラウザやその他のソフトウェアを操作することについても議論している。

        GPT-4 をテストしたある関係者は、Gemini には少なくとも 1 つの点で GPT-4 よりも優れていると述べました。Web 上の公開情報に加えて、Gemini は Google が消費者向け製品から取得した膨大な量の独自データを活用しています。したがって、このモデルは、特定のクエリに対するユーザーの意図を特に正確に理解する必要があり、不正解 (幻覚など) が少なくなるように見えます。


Google Cloud サービスが追いつくチャンス

        今年初めに OpenAI が GPT-4 へのアクセスの販売を開始して以来、Google はここ数カ月間、既存の商用モデルをより多くの開発者が利用できるように積極的に取り組んでいます。

        今年 5 月、Google は Vertex AI を通じて Google Cloud の顧客に PaLM 2 を提供すると発表しました。この件に詳しい別の関係者によると、GoogleはGoogle Cloud Vertex AIサービスを通じて、さまざまなサイズのバージョンを含む「Gemini」を企業に提供する予定で、開発者は単純なタスクを処理するために複雑でないバージョンを購入するか、購入するかを選択できる個人のデバイスで実行できるほど小さいバージョン。

        同関係者は、Googleは現在開発者にGeminiの比較的大きなバージョンの使用を許可しているが、GPT-4に近い開発中の最大バージョンの使用は許可していない、と付け加えた。

写真

        Googleにとって、Geminiの発売は大きな出来事だ。Google は、このソフトウェアが同社のクラウド サーバー レンタル ビジネスを促進するだけでなく、Bard チャットボットから Workspace ソフトウェアに至るまでの新機能のサポートも提供することを期待して、OpenAI に対抗するツールとしてこのソフトウェアの開発に多くのコンピューティング リソースと人材を費やしました。

        OpenAIや、企業の人工知能の開発と利用を支援するDatabricksなどの他のソフトウェア企業も、会話型AIから多大な収益を生み出すと予測しているとThe Informationは報じた。しかし、オープンソースの大規模モデルの台頭により、独自モデルへのアクセスを販売する Google と OpenAI への注目が薄れる可能性があります。

        おそらくいつかあなたが目を覚ますと、ジェミニが正式に解放され、その謎が完全に明らかにされるでしょう。

        GoogleはGeminiで事態を好転させることができるだろうか?辛抱強く待つしかありません。

おすすめ

転載: blog.csdn.net/leyang0910/article/details/132911829