15の異なる分野のQ&A比較、ChatGPTモデルバトル:Baidu Wenxin YiyanとKunlun Wanwei Tiangongの国内版はGPT-4を打ち負かすことができますか(Baidu Wenxin Yiyan、Kunlun Wanwei Tiangongを含む個人内部テスト体験テスト招待コード取得方法、個人テストは有効です)

序文

3 月 16 日、Baidu は北京の本社で記者会見を開き、新世代の大規模言語モデルと生成 AI 製品をテーマにしました。Baidu の創設者であり、会長兼 CEO であるロビン・リーは、文学作品の作成、商業コピーライティングの作成、数学計算、中国語理解、マルチモーダル生成など、5 つの使用シナリオで Wenxin Yiyan の包括的な機能を実証しました。公式声明によると、Wenxin Yiyan の大規模モデルのトレーニング データには、数兆の Web ページ データ、数十億の検索データと画像データ、1 日あたり数百億の音声通話、5500 億のファクトのナレッジ グラフなどが含まれています。中国語の処理におけるユニークな位置にあります。革新的な生産性ツールとして、Wenxin Yiyan は人間の意図をある程度理解する能力を備えており、回答の正確性、論理性、流暢性は徐々に人間のレベルに近づいています。
ここに画像の説明を挿入

4月17日の午後、Kunlun WanweiのCEOであるFang Hanは、同社の大規模な中国語モデルであるTiangong 3.5をリリースしました。このモデルは、「Wen Xin Yi Yan」、「360 Zhi Nao」など、中国で数少ない社内テスト済みの中国語モデルの 1 つです。記者会見で、Tiangong の大型モデルは、週報を書いたり、求人情報を書いたり、コードを書いたり、ネチズンからの奇妙な質問に答えたりする機能を実演しました。

ここに画像の説明を挿入

Baidu 内部テスト アプリケーション

Baidu の内部テスト資格の申請方法の詳細については、私の別のブログを参照してください:
Baidu のジェネレーティブ AI 製品 Wenxin は、AI 作成の新しい奇跡を体験するようにあなたを招待します: Baidu の CEO、Robin Li は、3 つの主要な産業が機会をもたらすことを詳細に明らかにします

Tiangong 内部テスト アプリケーション

適用する方法

申し込みメールをメール:[email protected] に送信

テキストには次の内容を含める必要があります。

名前:
会社名:
役職:
電話番号:
応募理由:

約 10 日間の待ち行列の後、ブロガーは内部テストに合格したというメールを受け取りました。次のように:

ここに画像の説明を挿入

ベータ版体験

内部テスト Web サイトにログインします。

申し込み時に携帯電話番号を入力

ここに画像の説明を挿入

招待コードを入力してください:

ここに画像の説明を挿入

携帯電話の確認コードを入力してください:

ここに画像の説明を挿入

ログイン インターフェイス

ここに画像の説明を挿入

ランニング体験

Tiangong が生成する答えはあまり連続的ではなく、しばしば途中で一時停止してから次の文を生成するように感じます。これがネットワークの速度によるものなのか、システムが時間バッファを設定したのか、最近の内部テストで人が多すぎてプラットフォームが遅くなったのかはわかりません.

内部試験比較

注: 以下の評価内容はすべて非専門的な評価であり、個人的な使用の評価のみを目的としており、経験と参照のみを目的としています。その中で、ChatGPT は GPT-4 モデルと指定されていない限り、ChatGPT3.5 モデルを使用することがほとんどです。

基本的な質問と答え

  • バイドゥ ウェンシン イーヤン

ここに画像の説明を挿入

  • 天宮

ここに画像の説明を挿入

  • チャットGPT

ここに画像の説明を挿入

3つの基本的な質問と回答については、基本的に質問はありません。

事実の質問と答え

  • バイドゥ
    ここに画像の説明を挿入

  • 天宮
    ここに画像の説明を挿入

  • チャットGPT
    ここに画像の説明を挿入

この部分では、3 つの回答で問題ありませんが、Baidu と Tiangong は比較的詳細な回答を提供します。

ポピュラー サイエンス ライティング

  • バイドゥ
    ここに画像の説明を挿入

  • 天宮
    ここに画像の説明を挿入

  • ChatGPTのこの部分では
    ここに画像の説明を挿入
    、Tiangong、Baidu、ChatGPT にはそれぞれ独自の長所と短所があります。

小紅書のコピーライティング

  • バイドゥ
    ここに画像の説明を挿入

  • 天宮
    ここに画像の説明を挿入

  • ChatGPTは、
    ここに画像の説明を挿入
    コピーライティングに関しては誰もが大丈夫だと感じていますが、携帯電話のパラメーターの詳細に関しては、実際の状況とは多少の矛盾があるでしょう. また、Tiangong は絵文字を追加しませんでしたが、一般的に言えば、Baidu の方がわずかに優れています。

プロジェクト計画書

  • バイドゥ
    ここに画像の説明を挿入

  • 天宮
    ここに画像の説明を挿入

  • チャットGPT
    ここに画像の説明を挿入

プロジェクト計画の作成において、小さな問題を除いて、Tiangong はプロジェクト計画の詳細と時間の点で比較的完成しています。Baidu はテンプレートを適用するような感じです。ChatGPT の時間に問題がありますが、プロジェクトの計画はまだ良いです。

しかし、GPT-4 での答えは完璧と考えるべきです!

  • GPT-4

ここに画像の説明を挿入

古文理解

  • バイドゥ
    ここに画像の説明を挿入

  • 天宮
    ここに画像の説明を挿入

  • ChatGPTの部分では
    ここに画像の説明を挿入
    、Tiangong や ChatGPT よりも Baidu の方がわずかに優れていますが、一部の文字は認識されません。

常識的な能力と反事実の推論をモデル化する

  • バイドゥ
    ここに画像の説明を挿入

  • 天宮
    ここに画像の説明を挿入

  • ChatGPT
    ここに画像の説明を挿入
    のこの部分については、Baidu Wenxin の言葉が最も完璧な回答です (以前の評価 Baidu は、基本的には Tiangong と同じであることがわかりましたが、モデルを更新する必要があり、回答は後で完璧になります)、Tiangong は直接適用しますテンプレートと回答の間違い。

コードの理解

  • バイドゥ
    ここに画像の説明を挿入

  • 天宮
    ここに画像の説明を挿入

  • ChatGPT は、
    ここに画像の説明を挿入
    Tiangong のコード理解能力も優れており、Baidu がわずかに弱いとは予想していませんでした。

法務関連

  • バイドゥ
    ここに画像の説明を挿入

  • 天宮
    ここに画像の説明を挿入

  • ChatGPTのこの部分で
    ここに画像の説明を挿入
    、Tiangong はより多くの提案を非常に詳細に提供しました。これは、Tiangong の完全な勝利と言えます。

広告

  • バイドゥ
    ここに画像の説明を挿入
  • 天宮
    ここに画像の説明を挿入
  • チャットGPT
    ここに画像の説明を挿入
  • GPT-4 は
    ここに画像の説明を挿入
    言うまでもなく、GPT-4 は非常に完璧な広告スピーチであり、Baidu と Tiangong は関連するテンプレートを適用して生成されたものであり、魅力的ではありません。

番号順

  • バイドゥ
    ここに画像の説明を挿入
  • 天宮
    ここに画像の説明を挿入
  • ChatGPT
    ここに画像の説明を挿入
    の部分では、Tiangong の数学的能力はまだ貧弱であることがわかります.ChatGPT と Baidu の両方が最終的に正しい答えを出力することができます.一方、Tiangong は Python コードの一部を提供するだけで、基本的に質問の重要なポイントに答えませんでした. .

数値計算

  • バイドゥ
    ここに画像の説明を挿入

  • 天宮
    ここに画像の説明を挿入

  • チャットGPT
    ここに画像の説明を挿入

数値計算部分に関しては、Baiduだけが最終的に正解を示し、ChatGPTは計算プロセスを示しましたが、乗算計算では間違った答えを示し、Tiangongはすべて間違っていました.

推論

  • バイドゥ
    ここに画像の説明を挿入

  • 天宮
    ここに画像の説明を挿入

  • チャットGPT
    ここに画像の説明を挿入

この部分では、バイドゥは完全な勝利と見なされ、正解を示すだけでなく、推論プロセスも示しています。ChatGPTの最終的な回答は正しいのですが、推論過程に小さな問題があり、多かれ少なかれ推論を繰り返しています。しかし天宮はミスを犯した。

クロスランゲージ能力

  • バイドゥ
    ここに画像の説明を挿入
  • 天宮
    ここに画像の説明を挿入
  • ChatGPT
    ここに画像の説明を挿入
    における言語間モデルの理解には、基本的に問題はありません。

ヴィンセント図

3 つの中で、Baidu Wenxin Yiyan だけが画像を直接生成できます.ChatGPT と Tiangong は、無料の画像データベースを使用して画像を生成するだけです.たとえば、世界最大の無料の画像データベースの 1 つである Unsplash を使用します.画像は無料の著作権を持ち、 API インターフェイスはオープンであり、ChatGPT と Tiangong が Unsplash 画像を生成するための基本的な条件を提供します。

  • バイドゥ
    ここに画像の説明を挿入
  • 天宮
    ここに画像の説明を挿入
  • チャットGPT
    ここに画像の説明を挿入

要約する

全体として、Baidu Wenxin Yiyan モデルは依然として Tiangong よりも強力であり、Tiangong は数学と科学において明らかな欠点がありますが、意味理解などのテキスト面では依然として優れています。

国内モデルと海外モデルを総合的に比較すると、特にGPT-4モデルと比較すると、国内GPTモデルの全体的なレベルにはまだわずかなギャップがありますが、このギャップは徐々に縮小すると確信しています. いつか国産の大型モデルがOpenAIの大型モデルに対抗、あるいは追い越す日が来るでしょう。

その他の情報ダウンロード

人工知能関連の学習ルートと知識システムについて引き続き学習したい場合は、私の別のブログ「ヘビー| 完全な人工知能 AI 学習 - 基礎知識学習ルート」をお読みください。すべての資料は、料金を支払うことなく、ネットワーク ディスクから直接ダウンロードできます。このブログ
は、Github の有名なオープン ソース プラットフォーム、AI テクノロジ プラットフォーム、および関連分野の専門家 (Datawhale、ApacheCN、AI Youdao、Dr. Huang Haiguang など) を参照しています。約 100G の関連資料があります。すべての友達を助けます。

おすすめ

転載: blog.csdn.net/qq_31136513/article/details/130481363