目次
序文
3 月 16 日、Baidu は北京の本社で記者会見を開き、新世代の大規模言語モデルと生成 AI 製品をテーマにしました。Baidu の創設者であり、会長兼 CEO であるロビン・リーは、文学作品の作成、商業コピーライティングの作成、数学計算、中国語理解、マルチモーダル生成など、5 つの使用シナリオで Wenxin Yiyan の包括的な機能を実証しました。公式声明によると、Wenxin Yiyan の大規模モデルのトレーニング データには、数兆の Web ページ データ、数十億の検索データと画像データ、1 日あたり数百億の音声通話、5500 億のファクトのナレッジ グラフなどが含まれています。中国語の処理におけるユニークな位置にあります。革新的な生産性ツールとして、Wenxin Yiyan は人間の意図をある程度理解する能力を備えており、回答の正確性、論理性、流暢性は徐々に人間のレベルに近づいています。
4月17日の午後、Kunlun WanweiのCEOであるFang Hanは、同社の大規模な中国語モデルであるTiangong 3.5をリリースしました。このモデルは、「Wen Xin Yi Yan」、「360 Zhi Nao」など、中国で数少ない社内テスト済みの中国語モデルの 1 つです。記者会見で、Tiangong の大型モデルは、週報を書いたり、求人情報を書いたり、コードを書いたり、ネチズンからの奇妙な質問に答えたりする機能を実演しました。
Baidu 内部テスト アプリケーション
Baidu の内部テスト資格の申請方法の詳細については、私の別のブログを参照してください:
Baidu のジェネレーティブ AI 製品 Wenxin は、AI 作成の新しい奇跡を体験するようにあなたを招待します: Baidu の CEO、Robin Li は、3 つの主要な産業が機会をもたらすことを詳細に明らかにします
Tiangong 内部テスト アプリケーション
適用する方法
申し込みメールをメール:[email protected] に送信
テキストには次の内容を含める必要があります。
名前:
会社名:
役職:
電話番号:
応募理由:
約 10 日間の待ち行列の後、ブロガーは内部テストに合格したというメールを受け取りました。次のように:
ベータ版体験
申し込み時に携帯電話番号を入力
招待コードを入力してください:
携帯電話の確認コードを入力してください:
ログイン インターフェイス
ランニング体験
Tiangong が生成する答えはあまり連続的ではなく、しばしば途中で一時停止してから次の文を生成するように感じます。これがネットワークの速度によるものなのか、システムが時間バッファを設定したのか、最近の内部テストで人が多すぎてプラットフォームが遅くなったのかはわかりません.
内部試験比較
注: 以下の評価内容はすべて非専門的な評価であり、個人的な使用の評価のみを目的としており、経験と参照のみを目的としています。その中で、ChatGPT は GPT-4 モデルと指定されていない限り、ChatGPT3.5 モデルを使用することがほとんどです。
基本的な質問と答え
- バイドゥ ウェンシン イーヤン
- 天宮
- チャットGPT
3つの基本的な質問と回答については、基本的に質問はありません。
事実の質問と答え
-
バイドゥ
-
天宮
-
チャットGPT
この部分では、3 つの回答で問題ありませんが、Baidu と Tiangong は比較的詳細な回答を提供します。
ポピュラー サイエンス ライティング
-
バイドゥ
-
天宮
-
ChatGPTのこの部分では
、Tiangong、Baidu、ChatGPT にはそれぞれ独自の長所と短所があります。
小紅書のコピーライティング
-
バイドゥ
-
天宮
-
ChatGPTは、
コピーライティングに関しては誰もが大丈夫だと感じていますが、携帯電話のパラメーターの詳細に関しては、実際の状況とは多少の矛盾があるでしょう. また、Tiangong は絵文字を追加しませんでしたが、一般的に言えば、Baidu の方がわずかに優れています。
プロジェクト計画書
-
バイドゥ
-
天宮
-
チャットGPT
プロジェクト計画の作成において、小さな問題を除いて、Tiangong はプロジェクト計画の詳細と時間の点で比較的完成しています。Baidu はテンプレートを適用するような感じです。ChatGPT の時間に問題がありますが、プロジェクトの計画はまだ良いです。
しかし、GPT-4 での答えは完璧と考えるべきです!
- GPT-4
古文理解
-
バイドゥ
-
天宮
-
ChatGPTの部分では
、Tiangong や ChatGPT よりも Baidu の方がわずかに優れていますが、一部の文字は認識されません。
常識的な能力と反事実の推論をモデル化する
-
バイドゥ
-
天宮
-
ChatGPT
のこの部分については、Baidu Wenxin の言葉が最も完璧な回答です (以前の評価 Baidu は、基本的には Tiangong と同じであることがわかりましたが、モデルを更新する必要があり、回答は後で完璧になります)、Tiangong は直接適用しますテンプレートと回答の間違い。
コードの理解
-
バイドゥ
-
天宮
-
ChatGPT は、
Tiangong のコード理解能力も優れており、Baidu がわずかに弱いとは予想していませんでした。
法務関連
-
バイドゥ
-
天宮
-
ChatGPTのこの部分で
、Tiangong はより多くの提案を非常に詳細に提供しました。これは、Tiangong の完全な勝利と言えます。
広告
- バイドゥ
- 天宮
- チャットGPT
- GPT-4 は
言うまでもなく、GPT-4 は非常に完璧な広告スピーチであり、Baidu と Tiangong は関連するテンプレートを適用して生成されたものであり、魅力的ではありません。
番号順
- バイドゥ
- 天宮
- ChatGPT
の部分では、Tiangong の数学的能力はまだ貧弱であることがわかります.ChatGPT と Baidu の両方が最終的に正しい答えを出力することができます.一方、Tiangong は Python コードの一部を提供するだけで、基本的に質問の重要なポイントに答えませんでした. .
数値計算
-
バイドゥ
-
天宮
-
チャットGPT
数値計算部分に関しては、Baiduだけが最終的に正解を示し、ChatGPTは計算プロセスを示しましたが、乗算計算では間違った答えを示し、Tiangongはすべて間違っていました.
推論
-
バイドゥ
-
天宮
-
チャットGPT
この部分では、バイドゥは完全な勝利と見なされ、正解を示すだけでなく、推論プロセスも示しています。ChatGPTの最終的な回答は正しいのですが、推論過程に小さな問題があり、多かれ少なかれ推論を繰り返しています。しかし天宮はミスを犯した。
クロスランゲージ能力
- バイドゥ
- 天宮
- ChatGPT
における言語間モデルの理解には、基本的に問題はありません。
ヴィンセント図
3 つの中で、Baidu Wenxin Yiyan だけが画像を直接生成できます.ChatGPT と Tiangong は、無料の画像データベースを使用して画像を生成するだけです.たとえば、世界最大の無料の画像データベースの 1 つである Unsplash を使用します.画像は無料の著作権を持ち、 API インターフェイスはオープンであり、ChatGPT と Tiangong が Unsplash 画像を生成するための基本的な条件を提供します。
- バイドゥ
- 天宮
- チャットGPT
要約する
全体として、Baidu Wenxin Yiyan モデルは依然として Tiangong よりも強力であり、Tiangong は数学と科学において明らかな欠点がありますが、意味理解などのテキスト面では依然として優れています。
国内モデルと海外モデルを総合的に比較すると、特にGPT-4モデルと比較すると、国内GPTモデルの全体的なレベルにはまだわずかなギャップがありますが、このギャップは徐々に縮小すると確信しています. いつか国産の大型モデルがOpenAIの大型モデルに対抗、あるいは追い越す日が来るでしょう。
その他の情報ダウンロード
人工知能関連の学習ルートと知識システムについて引き続き学習したい場合は、私の別のブログ「ヘビー| 完全な人工知能 AI 学習 - 基礎知識学習ルート」をお読みください。すべての資料は、料金を支払うことなく、ネットワーク ディスクから直接ダウンロードできます。このブログ
は、Github の有名なオープン ソース プラットフォーム、AI テクノロジ プラットフォーム、および関連分野の専門家 (Datawhale、ApacheCN、AI Youdao、Dr. Huang Haiguang など) を参照しています。約 100G の関連資料があります。すべての友達を助けます。