内部テストに圧倒されているWen Xin Yiyanは、GPT-4に直面できますか?

バイドゥは2月7日、ChatGPT型人工知能製品「Wen Xin Yi Yan」の発売を発表し、3月に社内テストを完了して一般公開した。1 か月以上が経過した今日、北京の百度本社と上海の張江人工知能島に、予定どおり Wen Xin が到着しました。

Baidu の会長兼 CEO である Robin Li 氏は、Wenxinyiyan がビジネス コピーライティングと数学的計算において優れた能力を持っていることを紹介すると同時に、Wenxinyiyan は「完全に準備ができていない」ことも認めました。

国内市場の期待を背負って、Wenxiyiyan はなぜ急いでオンラインに移行したのですか? 業界関係者は、国内の GPT 技術の開発は、アプリケーション シナリオをつかむ機会を利用し、アルゴリズム技術の反復を支援する必要があると考えています.「追いつきながら学ぶ」ことによってのみ、国際的な AI に追いつくことができます。巨人。

中国語への理解が深まる

記者会見で、Li Yanhong 氏は文学作品の作成、商業コピーライティングの作成、数学計算、中国語理解、マルチモーダル生成など、5 つの使用シナリオで Wenxin Yiyan のパフォーマンスを実演しました。

文学創作の場面で、文心一言は有名なSF小説「三体問題」の核心内容を対話の質問に基づいて要約し、「三体問題」を書き続けるための5つの提案された角度を提案した。対話の質問と回答、要約分析、コンテンツの作成と生成の総合力。また、「三体問題」の作者やテレビシリーズの主役など、事実に基づく質問にも的確に答えてくれました。報告によると、AICG のコンテンツは、事実に基づく質問に回答する際に事実に基づく誤りを起こしがちですが、Wenxinyiyan は、事実に基づく質問の精度を大幅に向上させる、Baidu の知識を強化した大規模モデルのコンセプトを引き継いでいます。

コマーシャル コピーライティング シーンでは、Wenxin Yiyan は、会社のネーミング、スローガン、プレス リリースの作成などのクリエイティブなタスクも完了しました。

「優れた原稿を書くためには、私たちの意図を正確に理解することに加えて、AI は明確に表現する能力も備えていなければなりません。人間はよく「何千冊もの本を読む」と言いますが、AI は「何千億冊も読む」という意味です。本の。」 . Wenxin Yiyan の大規模モデルのトレーニング データには、数兆の Web ページ、数十億の検索データと画像、1 日あたり数百億の音声通話、5500 億のファクトのナレッジ グラフが含まれています。「研究によると、データの規模が十分に大きく、パラメータが数千億レベルに達すると、大規模なモデルの「インテリジェントな出現」が発生する可能性があります。特別に訓練されていない分野でも、知識の理解と論理的な推論能力は、現れる。」

Wenxin Yiyan には一定の思考能力もあり、数学的推論や論理的推論などの比較的複雑なタスクを学習できます。人間の論理的思考を働かせる「同じ檻の中の鶏とウサギ」のような古典的な質問に直面して、Wen Xin は質問の意味を理解し、質問を解決するための正しい思考を持ち、正しい手順に従って段階的に計算することができます。学生が質問をするのと同じように. 正解.

Wenxin Yiyan は中国市場の大規模な言語モデルに根ざしているため、中国語分野で高度な自然言語処理機能を備えており、中国語と中国文化で優れたパフォーマンスを発揮します。現場の実演では、文信は「洛陽志貴」という慣用句の意味とそれに対応する「洛陽志貴」の経済理論を正しく説明し、「洛陽志貴」という四文字でチベット語のアクロスティック詩を作った。

日常会話に加えて、Robin Li は Wenxin Yiyan のテキスト、写真、オーディオ、ビデオ、および四川方言などの方言でのスピーチを生成する能力も示しました。残念ながら、ビデオ生成機能はコストが高いため、この段階ではすべてのユーザーが利用できるわけではありません。

「マルチモダリティはジェネレーティブ AI の明確な開発トレンドです。将来的には、バイドゥが複数のモダリティで大規模モデルを統合する能力が高まるにつれて、Wenxinyiyan のマルチモーダル生成能力も向上し続けるでしょう。」

よく使う機能は正常に動作するが、バグが多い

「10月に妊娠し、1日で出産します。」 Li Yanhongは記者会見でWen Xiyiyanの誕生について説明しました.

Wenxin Yiyan の立ち上げは、数日間連続してストレス テストを受けていると報告されており、アジア最大の単一のインテリジェント コンピューティング センターである Shanxi Yangquan Baidu Intelligent Computing Center は、そのコンピューティング パワーを 1 秒あたり 400 億の浮動小数点計算にまで高めました。また、全国の他のいくつかのインテリジェント コンピューティング センターと連携して、Wenxin Yiyan にコンピューティング パワーのサポートを提供しています。

Wenxin Yiyan では、日常会話に加えて、レポートの作成、AI による描画、知識ポイントの確認のための 3 つの機能テンプレートも提供されています。

「従来のメディアの収束と変革」と題されたレポートで、Wen Xinyiyan は「メディアの収束」の意味を説明するだけでなく、デジタル変革、コンテンツの革新、ユーザー分析などの側面について提案を行いました。Xiaojing 兄弟は、これらのコンテンツが検索エンジンによって直接表示されるのではなく、大きなモデルによって分類および要約されることを発見しました。知識ポイントと AI ペインティングのチェックに関しても、Wenxin Yiyan は通常どおり実行し、通常は 1 分以内にフィードバックを返すことができます。

しかし、Xiaojing 兄弟は裁判中に、Wen Xinyiyan のコミュニケーションにはまだ多くの抜け穴があり、しばしば矛盾があることを発見しました。さらに、会話中のコンテキスト間のエコーがなく、1 対 1 の回答に似ています。

一部の内部テスト ユーザーは、同じ質問が Wenxiyiyan と GPT-4 に投げられたと述べており、2 つの回答の間には一定のギャップがありました。例えば、「三体問題」の続きで、「文信一言」の答えは、生命の意味や宇宙における人間同士の関係など、より抽象的なものであるのに対し、GPT-4の答えは、ヒューマノイドロボットの台頭、暗い森の法則への挑戦など、より具体的で矛盾する.

トライアル アプリケーションがテスト ページを混雑させる

今月 15 日に OpenAI は GPT-4 をローンチしましたが、市場のフィードバックは ChatGPT よりも優れており、Wenxinyiyan は本日ローンチされ、GPT-4 と比較されることは避けられません。

百度は早くも 2019 年に文心言語モデルを立ち上げました。これに基づく文心語も、長年にわたる百度の「蓄積とゆっくりとした開発」に属しますが、李延宏自身でさえ、次のように認めています。一言で言えば、ChatGPT や GPT-4 に対するベンチマークの敷居は依然として非常に高く、私自身のテストにはまだ多くの不完全性があると感じています。」

おそらく文信義燕の安定性を心配していたのか、李延宏は記者会見でライブデモンストレーションを使用せず、事前に録画されたビデオを使用して文信義燕の能力を示しました。Li Yanhong 氏はまた、このモデルにはまだいくつかの欠点があると述べ、「どの会社であっても、数か月でこれほど大きな言語モデルを作成することは不可能です。ディープ ラーニングと自然言語処理には、何年にもわたる継続と蓄積が必要です。」スピードアップする方法はありません。」

Wen Xinyiyan に対する資本市場の反応も理想的ではありませんでした。今日の午後、Baidu の香港株式市場は下落を続け、一時は 10% 近く下落し、その後わずかに縮小しました。終値の時点で、Baidu の株価は 1 株あたり 125.1 香港ドルで、6.36% 下落し、時価総額は 3,458 億香港ドルになりました。

Wenxin Yiyan が急いでオンラインになったのはなぜですか? Baidu が本日公開した 2 つのデータ セットは、問題を説明することができます.わずか 1 か月で、650 を超えるパートナーが Wenxin Yiyan エコシステムに参加することを発表しました.30,000 を超える企業ユーザーがテストされ、アプリケーション製品のテスト Web ページは何度も圧倒されました. 、Baidu Smart Cloud 公式 Web サイトのトラフィックは数百倍に急増しました。

「誰もが、最新かつ最先端の大規模言語モデルをより早く使用したいと考えています。」Robin Li が「Wen Xin Yi Yan」は完璧ではありませんが、市場が要求する場合は起動する必要があると率直に言ったのも不思議ではありません。

360の創設者であるZhou Hongyiも、「市場を時間と交換する」という慣行に公に同意しました。「現在、中国でのGPT技術の開発は、まずアプリケーションシナリオを占有し、同時にコアアルゴリズム技術を開発する必要があります.GPT技術のアプリケーションシナリオには、複雑なエンジニアリングと商業化能力、および豊富な経験が必要である.国内のアルゴリズムが GPT-4 に追いつくのを待ってからローンチすると、市場はそれを見逃してしまいます。

GPT の概念はアウトレットですか、それともバブルですか?

Wenxin Yiyan に加えて、多くの国内の機関や企業が GPT のような大型モデルを立ち上げました。今年の 2 月、Xiaoice の ChatGPT アプリケーション「X-Chain of Thought & Action」は、小規模な内部テストを開始しました。3 月の初めに、復旦大学コンピューター科学技術学部の Qiu Xipeng 氏のチームは、中国語の特徴を備えた大規模な中国語モデルを作成することを目標として、ChatGPT に似たモデル MOSS をリリースしました。 Microsoft と OpenAI の機能の組み合わせによって立ち上げられた新しい Bing モデルから学び、新世代のインテリジェント検索エンジンを立ち上げ、検索シナリオに基づく人工知能パーソナル アシスタント製品を立ち上げます。Alibaba Dharma の ChatGPT 製品はすでに内部テスト段階にあり、JD Cloud は ChatGPT の産業用バージョンを起動します—ChatJD... More 大規模モデルも内部テストを徐々に進めています。

International Data Corporation (IDC) によると、グローバル市場における人工知能市場の収益は 2021 年に 850 億ドルに達し、2025 年には 2000 億ドルを超え、複合年間成長率は 24.5% になると予測されています。中国証券建設投資の報告によると、中国の人工知能産業は急速に発展しており、世界の人工知能産業化分野では米国と欧州連合に次ぐ第 2 位であり、2022 年には世界市場の約 9.6% を占めています。 、中国の人工知能市場は2729億元に達するでしょう。

GPT の概念はアウトレットですか、それともバブルですか? 国立新経済研究院の初代所長である Zhu Keli 氏は、Mingjing 兄弟に次のように語っています。 . それは市場をつかむことを優先することができます. "彼はまた、投資家に盲目的にトレンドに従わないようにアドバイスしました. 一部の企業は技術的な利点がなく、株式市場の支持を得るためにChatGPTをギミックとしてのみ使用しています. バブルが崩壊すると、彼らは大きな損失を被ります。"

「AI 市場における爆発的な需要の増加は、前例のない指数関数的な商業的価値を解き放ちます。」Li Yanhong 氏は、大きな言語モデルが、クラウド コンピューティング、モデルの微調整、およびアプリケーション サービス プロバイダーという 3 つの主要な業界機会をもたらすと予測しました。, 画像生成、オーディオ生成、ビデオ生成、デジタル ヒューマン、3D などのシナリオで、多くのスタートアップのスター企業が出現しており、将来的には新しい巨人になる可能性があります。」

Guosen Securities Research Report はまた、AIGC の適用シナリオが全面的に爆発すると予想され、生産性ツールとして、チャット ロボット、デジタル ヒューマン、メタバースなどの分野の開発を引き続き促進すると考えています。人工知能の発展を促進するための 3 つの主要な要素として、アルゴリズムはまだ反復的であり、データの蓄積量は十分ではなく、計算能力は突破されたばかりです.「3 兄弟」の突破口は、新しいものを作成し続けます.フォーマットとアプリケーション。

おすすめ

転載: blog.csdn.net/weixin_42814075/article/details/129612430