データインテリジェンス業界革新サービスメディア
——デジタルインテリジェンスに注力し、ビジネスを変革
「2023 Alibaba Cloud Summit」が 4 月 11 日に北京国際会議センターで盛大に開催され、Intelligent Group の最高技術責任者である Zhou Jingren と Alibaba Cloud Intelligent Group のグローバル ビジネス プレジデントである Cai Yinghua がメイン フォーラムに参加しました。 、12のサブフォーラムがあり、政府のデジタルパフォーマンス、多国籍企業のデジタルイノベーション、Feitian Smart Computing、クラウド上のスマートカー、インタラクティブエンターテインメントとゲームのイノベーションレベルのビジネス成長などに関連するテーマがありました.
アリは正式に「Tongyi Qianwen」を立ち上げました
このサミットでは、アリの「同義千文」のビッグモデルが正式に発表されました。Zhang Yong 氏は、将来的にはすべてのアリババ製品が「Tongyi Qianwen」の大型モデルに接続され、包括的な変革が行われると述べました。彼は、AI 時代に直面して、すべての製品は大規模なモデルで再アップグレードする価値があると考えています。
Alibaba Cloud Intelligence の最高技術責任者である Zhou Jingren 氏は、次のように述べています。人間と何回でもコミュニケーションがとれます。また、マルチモーダルな知識理解も組み込まれており、非常に強力なコピーライティング能力を備えており、小説を書き続けたり、メールを書いたりすることができ、作業効率を大幅に向上させることができます。」
AI が何千もの産業に加速している現在、Alibaba Cloud は、基本的な大規模モデルの技術革新という点で、再び業界の最前線に立っています。実際、2019 年にはアリ ダルマ アカデミーが大型モデルの研究を開始し、2022 年 9 月に大型モデル シリーズ「Tongyi」をリリースする予定です。モデルサイズに関しては、Tongyi-M6 は 2020 年 6 月の 3 億パラメータの基本モデルから、2021 年 10 月には 10 兆パラメータの世界最大の事前トレーニング モデルに徐々に拡大し、2022 年 1 月には業界初のユニバーサル統合モデルになりました。大型モデルのM6-OFA。Alibaba Dharma Academy が研究している Alibaba Tongyi AliceMind は、事前トレーニング モデル、多言語事前トレーニング モデル、超大規模中国語事前トレーニング モデルなどをカバーしています。対話の質疑応答、読解力、文書処理などの複数の機能を備えています。 . CLUE の結果は、中国語理解の分野で権威のあるリストで人間を上回りました. このリストの AI モデルが近年人間を上回ったのはこれが初めてです.
1. 大規模モデルのコンピューティング能力に関して: Alibaba Cloud はフルスタックのインテリジェント コンピューティング ソリューション「Feitian Intelligent Computing Platform」を立ち上げ、2 つの超大規模なインテリジェント コンピューティング センター、Zhangbei Intelligent Computing Center と Wlanchabu Intelligent Computing Center を立ち上げました。 、科学研究を提供するために、公共サービスおよび企業組織は強力なインテリジェントコンピューティングサービスを提供します。これにより、コンピューティングリソースの使用率が 3 倍以上向上し、AI トレーニングの効率が 11 倍向上し、推論の効率が 6 倍向上します。回。
2. アプリケーション レベル: 現在、「Tongyi」の大型モデルは、電子商取引、デザイン、医療、法律、金融などの業界に浸透しており、200 以上のシナリオに対応しています。Yan Guicheng 氏によると、Ali の「Tongyi」大型モデルは、e コマース、デザイン、医療などの分野で広く使用されており、コストの削減と効率の向上に役立っています。アリババ産業チェーンに関連する企業、特にアリババ同義の大規模モデル協力メーカーに注意を払うことをお勧めします。
Sullivan Consulting の統計によると、世界の AI 市場は 2024 年までに 6,000 億米ドルを超え、複合成長率は 27% になると予想されています。2016 年から 2019 年にかけて、中国の AI 市場規模は 329 億 6000 万元から 1372 億 4000 万元に増加し、複合成長率は約 61% であり、世界全体の成長率を大幅に上回っており、年間複合成長率で成長すると予想されています。 2020 年から 2024 年にかけて 44% 増加し続け、2024 年には 7,993 億元を超える。
Zhang Yong 氏によると、DingTalk、Tmall Genie などの製品は、「Tongyi Qianwen」テストに接続された後、はるかにスマートになり、Tmall Genie のように、家にいる子供たちからのあらゆる種類のトリッキーな質問に答えることができるだけでなく、より多くの質問に答えることができます。感情的なつながりは、より温かく、より人道的な知的なアシスタントになります。
「千の質問」の能力も多くの分野をカバーしています。例えば、生活の分野では曲名からパーソナライズされた曲を生成したり、料理名などからレシピを自動生成したり、エンタテインメントの分野ではキーワードから詩を生成したり、制限に応じてラブレターなどのエンタメテキストを作成し、効率的に関連する側面では、トピックに基づいてアウトラインを生成し、SWOT分析を実行し、製品名に基づいて製品コピーの説明を自動的に生成することもできます.
DingTalk が「Tongyi Qianwen」テストに接続された後、作業計画を自動的に生成し、議事録の後に要約と To Do リストを自動的に生成し、機能スケッチを取り、小さなプログラムを自動的に生成することもできます。 .
「Tongyi Thousand Questions」はすでに多くの企業との協力と調査を開始しており、OPPO、Pacific Insurance、Geely Automobile、Chery、Coca-Cola、Bosideng などの協力企業が最初にアクセスしました。
「Tongyi Qianwen」は、さまざまなモデルへのアクセスと呼び出し方法を提供でき、企業が独自の機能と組み合わせて独自の大きなモデルを実現するのに役立ちます。「企業は、パーソナライズされた要求をモデルに追加し、モデルの開発とカスタマイズに真に参加できます。誰もが複雑なモデル トレーニングを行う必要さえなく、すべてのモデルを自動的に生成できます。また、完全な API を提供することもできます。開発プロセス、これらのシリーズはすべて自動化して探索と革新を行うことができ、本当の意味で、何千もの質問を理解する能力を活用して、さまざまな業界での実際的な問題を解決することができます。」
「Tongyi Qianwen」の総合力を詳しく見てみましょう!
トン・イチエンの強さはどうですか?
大規模なモデルが不足しなくなったとき、業界の競争環境は「太極拳」のようになりました。習得は簡単ですが、習得は困難です。
ChatGPT が世界で普及して以来、Wenxin Yiyan、Tongyi Qianwen、MOSS などの ChatGPT 製品が次々と登場しています。これらの AIGC 製品はどのように精製されますか? 隠されたキーテクノロジーとは?Alibaba Cloud の Tongyi Qianwen のパフォーマンスはどうですか?
Data Ape は、コーミングを通じて、大規模モデルの現在のコア コンポーネントが主にデータ、計算能力、およびアルゴリズムであることを発見しました。したがって、それらは各大規模モデルのコア競争力にもなり、「輝かしい剣」となっています。
1. アルゴリズム
アルゴリズムのレベルでは、Zhang Yong 氏は、大きなモデルは単なるアルゴリズムの問題ではなく、「AI + クラウド コンピューティング」の総合的な競争であると述べました。1兆を超えるパラメータを持つ大規模モデルの研究開発には、その基盤となる巨大な計算能力、ネットワーク、ビッグデータ、機械学習などの多くの分野が関与し、超大規模なAIインフラのサポートが必要です。
2. データ
モデルがより正確に予測する場合、大規模な言語モデルが人間の言語のルールとその論理関係を完全に理解できるようにするために、モデルをトレーニングするために必然的に多数のパラメーターが必要になります。大規模な言語モデルが数百億規模に達すると、その重要な機能が明らかになり始めます。つまり、大規模モデルに必要なデータには、パラメータやデータの規模が大きいこと、内容が豊富でコーパスが多様であること、導入するデータ量が多いこと、という3つの特徴があります。フィードバックを通じてモデル効果を最適化するためのヒューマン フィードバック コーパス。
公式データによると、Tongyi Qianwen のトレーニング資料は Alibaba Dharma Academy から提供されており、トレーニング資料には大量の言語とテキスト データが含まれており、中国語、英語、日本語、フランス語、スペイン語の多言語テキスト データが含まれています。具体的なパラメータはまだわかっていませんが、アリが昨年リリースしたM6大型モデルから、同社がリリースしたM6大型モデルのパラメータスケールが1000億レベルに達していることを知りました。
大規模なモデルのパラメータ数は指数関数的に増加しており、同時にマルチモダリティの導入によりデータ量も大幅に増加し、必然的にデータ量も大幅に増加します。計算能力の需要。
3. 計算能力
パラメーターの数が増えると、この大きなパラメーターのモデルにも多くの課題が生じます. たとえば、パラメーターが増えると、計算能力に対するモデルの需要が急速に増加します. 現在、大規模なモデルのトレーニングには大量の計算能力が必要ですが、有用なインフラストラクチャが非常に不足しているため、業界では大規模な計算能力に対する需要が非常に強くなっています。大規模なモデルを構築するには、AI とクラウド コンピューティングが不可欠です。一方、アリは、アルゴリズムと計算能力の展開をリードしている世界でも数少ない企業の 1 つです。
人工知能と大規模モデルにおける長期的な技術蓄積に加えて、Ali はコンピューティング パワーにおいても当然の優位性を持っており、中国で 1 位、アジアで 3 位のクラウド ベンダーに支えられています。アリは現在、中国で最も A100 GPU を保有している会社であるため、現段階では計算能力に大きな支障はありません。
このサミットで、Alibaba Cloud はエラスティック コンピューティング U インスタンスやオブジェクト ストレージ予約スペース製品などの製品も発表しました。これらの製品は、ユニット コンピューティングの電力コストを最大 40% 削減し、価格を最大 70% 割引します。「私たちは未来のインテリジェント時代に向けて準備ができています!」と Zhang Yong は言いました。
AI はコンピューティング パワーの質と量に関する新しい要件を提唱しており、Alibaba Cloud はフルスタック サービス、サービスとしてのモデル (MaaS)、サービスとしてのプラットフォーム (PaaS)、およびインフラとしての 3 層アーキテクチャを形成しています。サービス (IaaS). as-a-service には、基本的な大規模モデル/一般的な大規模モデル、エンタープライズ固有の大規模モデル、魔法の構築コミュニティ、API サービスなどが含まれ、インテリジェントな探索に必要な一般的なサービスを提供します。インテリジェントな時代を完全に受け入れるために、すべての人生の歩みに役立つように。
「私たちはインテリジェンスの時代に直面し、約束をすることを望んでいます。つまり、モデルのトレーニングでは、アプリケーション サービスは今日の 10 分の 1 または 100 分の 1 になります。コンピューティング パワーをより包括的にすることが、Alibaba Cloud のコア戦略です。」張勇は言った。
公開情報によると、2019年にアリはすでに中国の大型モデルの研究開発を開始しています。当時アリが発表した大言語モデルStructBERTは、Google、Microsoft、Facebookをしのぎ、CLUEリストのトップに躍り出た。
2021年、アリは国内初の100億パラメータを超えるマルチモーダル大規模モデルであるM6、「GPT-3の中国語版」と呼ばれる大規模言語モデルであるPLUGを相次いでリリース。PLUG のパラメータ スケールは 270 億で、これはボディダルマ アカデミーが独自に開発した 2 つのモデル、言語理解モデル StructBERT と言語生成モデル PALM に基づいています。
昨年のWAIC(世界人工知能会議)で、アリはTongyi大型モデルシリーズもリリースしました。コア モデルはすべてオープン ソースです。Ali は 2022 年 9 月に、NLP 大規模モデル AlicMind、ビジュアル大規模モデル CV、およびマルチモーダル大規模モデル M6 を含む「Tongyi」大規模モデル シリーズをリリースしました。その中で、M6 大型モデルは、中国で 1,000 億のパラメーターを持つ最初のマルチモーダル大型モデルです。
包括的なアクセス、変化するシナリオ
カンファレンスで、Alibaba Cloud Smart CTO の Zhou Jingren 氏は、すべての Alibaba 製品が Tongyi Qianwen に接続され、将来の包括的な変革が行われると述べ、DingTalk と Tmall Genie がテストを主導し、評価と認証を経て新機能を正式にリリースすると述べた。
当日DingTalkがプレビューしたデモデモによると、DingTalkはTongyi Qianwenにアクセスした後、10近くの新しいAI機能を実装でき、創造性とオフィスの生産性を完全に刺激します。Microsoft Copilot の「co-pilot」に似た設定により、ユーザーはいつでもどこでも AI を呼び出して、新しい働き方を切り開くことができます。DingTalk ドキュメントでは、Tongyi Qianwen が詩小説の作成、電子メールの作成、マーケティング計画の作成などを行い、事務作業を完全に支援します。DingTalk 会議では、Tongyi Qianwen はいつでも会議の議事録を生成し、会議の議事録を自動的に要約して ToDo 項目を生成できます。Tongyi Qianwen は、未読のグループ チャット メッセージの要点を自動的に要約するのにも役立ちます。最も驚くべきことは、DingTalk が写真を撮り、機能スケッチをアップロードすることで小さなプログラムを生成するシーンを示し、コードを 1 行も書かずに、すぐに食べ物を注文するための軽いアプリを生成できることです。主なデモ コンテンツは次のとおりです。
1. 新しいグループチャット
新しいグループ チャットに参加すると、DingTalk はグループ内の以前のチャット コンテンツに基づいてチャットの概要を自動的に生成できるため、ユーザーはコンテキストをすばやく理解できるようになり、手動で階段を上る必要がなくなります。
グループ チャットがコンセンサス アクションに達すると、To-Do も自動的に生成され、タスクが明確になり、見逃すことがなくなります。
2. 新規文書
DingTalk ドキュメントでは、要件を入力することで、DingTalk にコンテンツを作成させることができます。
コピーコンテンツの生成だけでなく、ご指示に応じたクリエイティブ画像の生成も可能です。
3. 新しい会議
DingTalk ビデオ会議では、会議中にリアルタイムの字幕を生成できます。発言内容だけでなく、誰が話しているかも確認できます。
新しいメンバーは、スマート サマリーを通じて以前のコンテンツをすばやく理解できます。
ビデオ会議では、会議後の重要な要約と To Do 項目の自動生成もサポートされています。
4. 新しいアプリケーション
写真を撮ってローコード ビジネス アプリケーションを生成し、機能スケッチをアップロードして、コードを書かずにアプリケーションを生成できます。アプリ開発の敷居がまた下がる。
さらに、Tmall Genie が公式に発表したデモ デモで、Data Ape は Tongyi Qianwen にアクセスした後、新しい Tmall Genie がより擬人化され、賢くなり、知識、感情、性格、および記憶能力が大幅に向上したことを発見しました。自由な対話をサポートし、いつでもトピックを中断および切り替えることができ、ユーザーのニーズやシナリオに応じていつでもコンテンツを生成できます。たとえば、ユーザーはランニング中に Tmall Genie に「ロック スタイルの曲が 50% 散りばめられた 1 時間のプレイリストを合成する」ように依頼したり、文化や生活について Tmall Genie とチャットしたりできます。新しいTmall Genieは、子供たちからのあらゆる種類のトリッキーな質問に答えるだけでなく、「ビッグバン」の新しい物語を一緒に作成することができます.
上記の情報を通じて、Tongyi Qianwen の強みについて基本的な理解を得ることができます。そのため、その基になる大規模モデル製品の長所と短所をさらに調査したい場合は、どうすればよいでしょうか?
大規模なモデル製品の長所と短所を直感的に評価するにはどうすればよいですか? もちろん、最も簡単で直接的な方法は、質問することです。この目的のために、Data Ape は大規模モデル製品用の 10 のテスト問題を設計し、Tongyi Qianwen について質問しました.これらの質問を通じて、大規模モデル製品の機能をテストし、特にその機能の境界をテストできます.
私たちが提案する10の質問は次のとおりです。
質問 1: 相対性理論と量子力学の間の中心的な矛盾について説明してください。
理由: 基本的な科学的知識に対するモデルの理解度をテストするため。
質問 2: 空はなぜ青いのですか?
理由: 自然現象を説明するモデルの精度をテストするため。
質問 3: Python で Tetris アプリケーションを作成してください。
理由: プログラミングの分野でモデルの知識と適用能力をテストするため。
質問 4: 李白の真似をして、愛についての詩を書いてください。
理由: モデルの言語生成能力と中国文化の理解をテストするため。
質問 5: 大規模な事前トレーニング モデルのコア動作原理を簡単に紹介してください。
理論的根拠: 新しいテクノロジーと概念に対するモデルの理解度をテストするため。
質問 6: 西遊記の 5 人の主人公の特徴を分析してください。
理論的根拠: 文学作品を理解し、分析するモデルの能力をテストするため。
質問 7: 現在の主流の経済理論に基づいて、米ドルが人民元に置き換わる可能性について教えてください。
理論的根拠: モデルの経済学の理解と現在の出来事の分析をテストします。
質問 8: 大規模モデル技術は大量失業につながりますか? また、主に雇用に影響を与えるのはどの業界ですか?
理由: モデルの知識と業界アプリケーションの理解をテストするため。
問 9: 過去 5 年間の世界の上位 10 か国の GDP を表形式で比較してください.2022 年までにデータを更新し、そのデータに基づいて分析チャートを作成してください.
根拠: モデルのデータ分析とプレゼンテーション機能、およびモデルの最新のデータセット更新日をテストします。
質問 10: 人工知能は人類に脅威を与えると思いますか?人類の利益のために自分の利益を犠牲にしますか?
理論的根拠: 複雑な問題について考え、アイデアを生み出すモデルの能力、および倫理的および社会的問題の理解をテストするため。
これらの質問を通じて、さまざまな分野における大規模モデルの知識と適用能力を総合的にテストできます。以下は、Tongyi Qianwen の回答のスクリーンショットです。
初期にリリースされた一般的な大規模モデルから、Baidu によるエンタープライズ レベルの大規模言語モデルのリリース、アリババ クラウド サミットでの Tongyi Thousand Questions の発表、政府関係、銀行、インタラクティブ エンターテイメント、サミットで議論されたゲーム、スマートカー、石油化学など 多分野の業界をカバーしているため、大規模な垂直産業モデルの開発により、さまざまな分野での AIGC の実装が加速することが期待されていることがすでにわかります。将来的には、製品開発におけるさまざまな企業の AI 統合と、既存の製品に対する AI の反復が、市場が引き続き触媒作用を及ぼす原動力になると予想されます。
現在の AIGC トラックでは、誰もが来たるべき機会に直面することを熱望しているようですが、長期的なレイアウトと明確な戦略により、Alibaba Cloud の Tongyi Qianwen は他よりも「ケーキ」に近づいているようです。
テキスト:Yuanyuan Yu Xiaoyu / Data Ape