3か月で79の基本的な大規模モデルが誕生 企業は大規模モデルを選ぶ際に何に注意すべきでしょうか?

ChatGPTの誕生以来、あらゆる大型モデルが後を絶たず登場し、競争はますます激化しています。

大企業の参入により、スタートアップ企業に次元低下の打撃がもたらされるのは間違いなく、スタートアップ企業はいつ潰れても未完のプロジェクトが残る可能性があります。

私も大型模型分野の最新動向には注目していますが、日々膨大な情報が入ってくる中で、自分なりの独自の思考枠組みを持ち、それを維持していくことが非常に重要であると考えたので、ここで紹介します。最近の情報も載せて、感想をみんなと共有しましょう。

実は、私がTo C市場に比べてTo B市場に注目しているのは、大型モデルが徐々に深海域に進出し、さまざまな業界への浸透が避けられない傾向になっているからです。

将来的にはすべての企業が大型モデルに大きく依存し、すべての製品が大型モデルに基づいて開発されることが予測されます。大きなモデルは、長期的にはどのようにビジネスの世界に真の影響を与えることができるのでしょうか? これは、次の段階でさらに注意を払う必要がある焦点です。

1.「AI大型モデル技術力評価報告書」の解釈

現在、代表的な国内大型モデルとしては、Wenxin (Baidu)、M6 (Ali)、Pangu (Huawei)、ChatGLM (Zhipu Technology)、Xinghuo (HKUST Xunfei)、Ririxin (Shangtang) などが挙げられます。

世界有数の IT 市場調査およびコンサルティング会社である IDC はこのほど、「AI 大規模モデル技術能力評価レポート 2023 年」を発表しました。この調査には中国市場の主流メーカー 14 社が参加し、大規模モデル技術メーカー 9 社を選定しました。ユーザーインタビューや調査を通じて、ユーザーが重視する技術力、製品機能、エコサービスなどの側面から総合的に評価を実施しました。

私がこのレポートに注目する理由は次のとおりです。

  1. 現在の国際情勢を踏まえると、中国ではBaiduからGoogle、Alibaba CloudからAWSに匹敵するような大規模モデルが1つか2つ登場すると考えており、私が常に国内の発展に注目している理由です。大型モデル。
  2. IDC は業界で高い認知度を持つ国際的な権威あるコンサルティング組織であるため、このレポートは権威あるものです。
  3. このレポートは、技術的な観点から大規模モデルを評価するだけでなく、アルゴリズム機能、業界の対象範囲、生態学的協力などの指標もカバーしています。私は、テクノロジーは密室で開発されるものではないと常々思っています。高いレベルと低いレベルはしばしば非現実的なものを意味します。結局のところ、テクノロジーはビジネスと社会に役立つものでなければなりません。

IDC が大規模モデルをどのように評価するかを詳しく見てみましょう。

  1. IDC は、大きなモデルをサービス エコロジー、製品テクノロジー、産業アプリケーションの 3 つのレイヤーに分割します。
  2. 各層の能力が評価され、主な指標はアルゴリズムモデル、汎用能力、イノベーション能力、プラットフォーム能力、セキュリティと説明可能性、大規模モデルの応用産業、サポートサービスと大規模モデルエコロジーなど(具体的には36の細かいものを含む)です。きめ細かな評価基準)により、各指標は1点から5点までの5段階で評価され、スコアが高いほどメーカーの大型モデルの技術力が高いことを示し、最終的な評価結果はレーダーチャートで表示されます。
  3. 大型モデルの選択において、IDC は主要な調査のために中国市場の大規模モデル テクノロジー メーカー 9 社を選択しました。すなわち、Alibaba、Baidu、4Paradigm、HKUST Xunfei、Lanzhou Technology、Yuncong Technology、Zhipu AI、China Telecom Zhike、Zhongke Wenge です。さらに、IDC は 360、MiniMax、Huawei、SenseTime、Tencent などの大型モデルも観察しました。

ps: IDC は、より多くのテクノロジー メーカーを対象とするために評価を更新し続けるとも述べました。

2. Wenxinモデルの優れたパフォーマンスは注目に値します

この評価では、Baidu の Wenxin 大規模モデルが非常に優れたパフォーマンスを示し、私の注目を集めたことは言及する価値があります。

具体的な性能は以下の通りです。

7 つのコア指標フルスコア (5 ポイント): アルゴリズム モデル、一般能力、イノベーション能力、プラットフォーム能力、生態協力、産業範囲、エネルギー産業。

国内のみ満点(5点)が3つ:アルゴリズムモデル、業界カバレッジ、エネルギー業界。

セキュリティの説明性、サービス力、金融業、産業業、医療業の5つの指標で4点。

以下の2枚の写真は、Wenxin大型モデルと他の国産モデルの水平比較と、各指標におけるWenxin大型モデル自体のスコアです。

ここでは「アルゴリズムモデル」と「業界カバレッジ」という2つの指標について説明したいと思います。

製品の技術的能力の中で、「アルゴリズム モデル」の次元は最も重要であり、大規模モデルの機能の中核要素であり、大規模モデルの適用効果を決定する根幹です。アルゴリズム モデル テクノロジのブレークスルーと、一般的な効果の利点を備えた大規模なモデル ベースの実現を通じてのみ、より広範な業界をサポートし、あらゆる階層がテクノロジのブレークスルーによってもたらされる利益を十分に享受できるようにし、敷居が高いというジレンマを解決できます。 AIの実装。

アプリケーション能力の点で、大規模模型メーカーにとって最も関心のある指標は、対象となる業界の広さです。「業界カバレッジ」は、企業レベルの顧客の数と上陸産業の数を通じて、産業実装における大規模モデルの強みを反映しており、大規模モデルの全体的な主導効果と業界を組み合わせる能力を包括的に示しています。

「アルゴリズム モデル」と「業界カバレッジ」という 2 つの中心的な指標には、固有の相関関係があります。業界カバレッジの広さは、アルゴリズム モデルの一般的なリーダーシップを集中的に表現しており、アルゴリズム モデルの継続的な改善のための継続的な正のフィードバックも提供します。アルゴリズム モデル機能、継続的な反復改善のためのフライホイールの形成。

Wenxin の大型モデルは、アルゴリズム モデルの次元で唯一のフルスコアを獲得しました。これは、大型モデルのコア テクノロジーにおける Baidu の先行者利益を反映しています。Baidu は 2019 年から事前トレーニング モデルの研究開発に深く関わっており、知識を強化した Wenxin シリーズのモデルを次々とリリースしてきました。Wenxin Large Model の最新バージョン 3.5 では、基本モデルのアップグレード、技術革新の微調整、知識の強化、論理的推論の強化などが実現されました。新バージョンでは、効果、機能、パフォーマンスが包括的に向上しました。

さらに、この評価レポートに加えて、他の公開評価では、Wenxin Big Model 3.5 によってサポートされる Wenxinyiyan の中国語能力が傑出しており、GPT-4 をも上回り、総合的な能力が評価で ChatGPT を上回り、他の大型モデルを大きく上回っていることが示されています。

SuperCLUEの最新評価リストではWenxinyiyan選手がGPT3.5turboやGLM130Bを上回りました。

3. 企業向けの大規模モデルの選び方

「AI大規模モデル技術力評価報告書」の結果を踏まえ、大規模モデルの選定について考えるきっかけとなったのですが、前述の通り、今後はあらゆる企業が大規模モデルに大きく依存することになります。

それでは、商用モデルを選択するべきでしょうか、それともオープンソースモデルを選択すべきでしょうか、大規模な工場と協力することを選択するべきでしょうか、それとも新興企業と協力することを選択するべきなのでしょうか? これらは避けられない問題となっています。

結論から先に言いますと、大手メーカーの市販モデルを選ぶのがベストです。その理由は次のとおりです。

1. 時間は最も貴重な資源です

スタートアップ企業であっても、ある程度の規模の企業であっても、激化する今日の市場で発展を図るために最も重要なリソースは何でしょうか?時間だ、これは時間との勝負だ。

あなたはオープンソース モデルが GPT-3 の機能から GPT-3.5 に進化するのを待っている一方で、ライバル会社は GPT-4 機能を備えた商用モデルを直接立ち上げ、製品機能やユーザー エクスペリエンスの点であなたを直接打ちのめします。したがって、この観点からすると、先行者利益を得るには、大規模商用モデルを選択することが唯一の選択肢となります。

2. To B の大規模モデルの場合、パラメーターよりも業界での経験がはるかに重要です

前述したように、密室でパラメータや規模に焦点を当てることは無意味であり、To B シナリオでは、蓄積された業界経験が決定的な役割を果たすことがよくあります。

私がこれまでに収集した情報によると、Baidu はすでにこの分野で主導的な地位にあり、過去数か月間、Baidu Smart Cloud は化学、製造、エネルギー、自動車の分野で頻繁に新たな動きを見せています。例えば、BMW Brilliance は 7 月初旬に Baidu との戦略的提携を発表し、両社は有利なリソースを共有し、AI テクノロジーと世界的な自動車製造業界の統合と革新を模索していくと発表しました。先月、SinopecとBaiduは、産業用人工知能インフラストラクチャの構築、デジタルトランスフォーメーションとアップグレード、大型モデルなどの新技術イノベーションを含む6つの主要分野で協力する戦略的協力協定に署名した。電力業界では、5月に百度が中国南方電力網と覚書を締結し、AIと配電の統合・革新を共同で推進する。

これはまた、百度の文新モデルが先行者利益に基づいて、あらゆる面で間違いなくリードしていることを意味します。

おすすめ

転載: blog.csdn.net/qq_35190492/article/details/131916255