私たちも大型モデルに対して「迷信的な権威」を持っていると思いますか?
ChatGPT のGPT-4 は評判が良いので、私たちは無意識にそれを信じて最初に使用します。しかし、私は長い間 ChatALL を使用して AI モデルを比較し、得た結論は次のとおりです。
ChatGPT GPT-4 はほとんどの場合において確かに最強ですが、それはコスト、アクセスの難しさ、タイトルのリスク、その他の条件の組み合わせによるものではありません。ほとんどの人が使用している ChatGPT 3.5 は言うまでもありません。
それで誰が一番強いのでしょうか?ビンチャット!最初に客観的な事実をいくつか挙げてから、主観的な分析を行います。
チャットGPT 3.5 | チャットGPT 4 | Bing チャット | |
---|---|---|---|
料金 | 無料 | 月額 20 ドル | 無料 |
登録する | 外国の携帯電話番号 | 外国の携帯電話番号 | 任意のメールボックス |
IPをブロックする | 多くの | 多くの | 少し |
アカウントを閉じる | 持っている | 持っている | なし |
ブラウザ対応 | 良い | 良い | 只 Edge |
上の表からわかるように、ブラウザの互換性を除けば、Bing Chat の方が優れています。
次に、モデルの効果を主観的に分析します。結局のところ、これが王道です。
まず噂話をさせてください。Bing Chat は ChatGPT よりも早く GPT-4 モデルを使用していたと言われています。もしかしたら初日から GPT-4 になるかもしれません。しかし、なぜ当時、Bing Chat が ChatGPT 3.5 よりも強力だと誰も言わなかったのでしょうか? おそらく星の暈のせいでしょう。
Bing Chat の 3 つのスタイル (創造性、バランス、精度) は、最初から同じモデルに異なる温度を設定するほど単純ではありません。
当初、創造性のモデルは h3imaginative、バランスは Harmonyv3、精度は h3precise でした。ネーミング的にもバランスがとてもユニークです。その後、ある日「バランス」がさらにユニークなガリレオ(Galileo)になったとは知りませんでした。
chatall.ai を使用してプロンプトを同時に送信すると、明らかに「バランス」の生成が速くなったことが感じられます。これは、基本モデルが他の 2 つとは大きく異なることも示しています。それは GPT-3.5 である可能性もあれば、GPT-4 の最新の調整されたバージョンである可能性もあります (現在の 3.5 がオリジナルの 3.5 よりもはるかに高速であるのと同じように)。後者の可能性が高くなります。
言い換えれば、Bing Chat は無料の GPT-4 ですが、なぜわざわざ ChatGPT をいじる必要があるのでしょうか?
上記の分析に十分な説得力がない場合は、客観的なデータを見てみましょう。
以下は、5 月の chatall.ai の統計です。
データの説明:
- 送信、ハイライト、削除、コピーの 4 つの列は、ユーザーが大きなモデルに対して対応する操作を行った回数であり、「割合」はその名のとおりです。
- 「ハイライト」が強調表示され、結果が良好であることを示します。しかし、ChatALL のデータを長期間保存する機能は十分ではないため、この操作にはほとんど意味がなく、問題をうまく説明できません。
- 「削除」は、この結果があまりにも悪いので二度と見たくないことを意味します。ただし、ChatALL はこの期間中に Bing Chat に多くのバグを作成したため、多数のエラー メッセージが削除された可能性があります
- 「コピー」とは、この結果を梱包して使用するために持ち帰ったという意味ですが、これもまた一種の認識であり、最も強い認識かもしれません。
正直に言うと、ベースが十分に大きくなく、さまざまな欠陥があるため、このデータは参考程度にしか使用できません。ただし、ChatGPT のハローの祝福を考慮すると、Bing Chat は ChatALL バグによって悪影響を受けており、Bing Chat と ChatGPT 4 が実質的に同等であると説明できます。
転載:https://zhuanlan.zhihu.com/p/633148476