Apex DFM-2 言語モデルが正式にリリースされました

7 月 12 日、[東風聖武] Apex DFM-2 大型モデルおよび革新的技術応用成果発表会が蘇州で成功裡に開催されました。

会議では、Spiemaxの会長兼最高経営責任者(CEO)のGao Shixing氏と共同創設者兼主席研究員のYu Kai氏がそれぞれSpiechの将来戦略とDFM-2大型モデルに代表される会話型AIの革新的な技術について共有した。Mercedes-Benz、SAIC-GM-Wuling、Great Wall Motors、Hezhong New Energy、PATEO Internet of Vehicles、China Unicom Smart Network、Jiadu Technology、Hisense、Robam、Haier、Changhong Meil​​ing およびその他のパートナーが出席し、一緒に探索するよう招待されました。 -大規模モデルテクノロジーと業界シナリオの深度統合と実装。

Gao Shixing 氏は、Aspire は独自の新技術の「原点」となることを敢えてしており、独自のイノベーションとアプリケーションのイノベーションの両輪の推進力を備えていると述べ、「クラウド + コア」戦略を中心に、会話型 AI を中心とした DFM- 2 大型モデル テクノロジーと包括的なフルリンク テクノロジーの組み合わせにより、AI ソフトウェアおよびハードウェア製品の標準化機能と DUI プラットフォームの大規模なカスタマイズ機能が継続的に向上し、スマート カー、スマート ホーム、家庭用電化製品、金融、鉄道交通、政務などのデジタル政府と企業 業界シナリオにおける顧客の複雑で個別のニーズを満たすために、大規模な業界言語モデルを作成し、業界のアップグレードを強化します。

Aspire は人工知能テクノロジー業界の実装に深く関与しており、スマート カー、スマート ホーム、家庭用電化製品などの主要なアプリケーション分野での市場シェアは増加し続けています。2019年に自動車フロントローディング分野に正式参入して以来、Aspireは累計600万台以上の車両を生産し、量産モデル数は80に達し、2022年だけでもAspire音声製品を搭載したスマートホームが出荷され、家庭用電子端末の数は約 3,000 万台で、2022 年に、Aspire は「音声 + 言語」フルシーン対話テクノロジーをカバーする「言語コンピューティングのための国家新世代人工知能オープンイノベーションプラットフォーム」の構築が承認されました。江蘇省で初めて企業として承認されました。将来的に、Aspireは人工知能の上流および下流産業と深く協力し、業界レベルのパートナーと協力してエコロジーを構築し、中国でのAI運命のコミュニティの構築を支援し、質の高い経済発展を促進します。

時代に合わせて: 大規模言語モデル + 包括的なフルリンク テクノロジー

今回の記者会見の核となるYu Kai氏は、音声言語モデルと会話AI技術の最新の応用成果をわかりやすく紹介した。

「大規模モデル + 言語コンピューティング」が汎用人工知能 (AGI) 生成の鍵となります。大規模モデル時代の言語コンピューティングには、状況理解、命令学習、思考連鎖推論という 3 種類の機能が登場し、一般的な人工知能への注目が高まっています。


Yu Kai 氏は、会話言語コンピューティングは統計対話、深層学習、大規模モデルの時代を経験していると紹介しました。ソースイノベーションと継続的イノベーション能力を備えたテクノロジーベースの企業として、Aspire は 2010 年以来、関連分野で数多くの国際競争選手権で優勝しています。同社は、中国で最も早く会話型人工知能シリーズテクノロジーの研究開発を開始した企業の 1 つです。 、上海通信と協力しており、大学のクロスメディア言語知能研究所やGusu Laboratoryなどの研究機関は、基礎技術の共同革新を行っています。産業用アプリケーションの実装を継続的に強化する過程で、Aspire は会話型人工知能テクノロジーに焦点を当て、ヒューマン マシン対話システムを継続的にアップグレードしています。

2013年にはフルリンククローズドループを実現する対話ファクトリーを開発、2015年にはソフトウェアとハ​​ードウェア連携のクラウド統合を実現したAIOSシステム、2017年にはフルシステムによる大規模でカスタマイズ可能な柔軟な人工知能を実現しました。 -link インテリジェント対話カスタマイズ プラットフォーム (DUI プラットフォーム) DFM-2 大規模言語モデルを通じて一般的な人工知能の柔軟なカスタマイズが実現され、大規模で高品質でパーソナライズされた人工知能システムのカスタマイズを実行できます。顧客の個別のニーズを満たすだけでなく、標準化されたソフトウェアおよびハードウェア製品の「非標準」の効率も大幅に向上します。


音声 DFM-2 言語モデル


その場でユウカイは、Spiech社が開発した大規模対話言語モデル「DFM-2(Dialogue Foundation Model)」を正式にリリースした(中国語直訳すると「一般対話基盤モデル」。戦略軍事力のコードネームはペイペイ)これは、我が国の中核となる戦略的技術の自立と独立した探求の精神に敬意を表するものであり、また我が国の AI 産業の大きな将来性を暗示しています。

2021 年に、研究開発チームは統合生成対話理解フレームワークである UniDU (DFM-0) をリリースし、2022 年にチームは理解、生成、表現のすべてのタスクを統合し、統合生成対話理解フレームワークである DFM-1 を開発します。このモデルは、10 億レベルの大規模モデルとして小規模製品に適用されてきましたが、現在、研究開発チームは大規模な開発を通じて 100 億レベルの大規模産業言語コンピューティング モデル DFM-2 を形成しています。スケールのアップグレードと産業用のカスタマイズ。公開データセットに対するいくつかの国際テストでは、DFM-2 は、同じサイズの数百億の大規模モデルのパフォーマンスにおいて明らかにリードしています。DFM-2 は「産業言語コンピューティング モデル」として位置付けられており、包括的なフルリンク会話型 AI テクノロジーと組み合わせることで、垂直領域で産業アプリケーションを実装する機能を備えています。

勢いを増す: 一般的なインテリジェンスを備えた大規模な業界言語モデル

現在の人工知能産業の応用における主な矛盾は依然として、テクノロジーメーカーの汎用技術とBエンド企業の非常に柔軟な個別ニーズとの間の矛盾であることが実践によって証明されています。現時点では、大規模な汎用言語モデルは、産業アプリケーションにおけるプライベート ドメインの知識の封じ込めや不正確さ、識別タスクの精度と適時性の不足、データ セキュリティと計算の信頼性の問題、高コストと低速といった問題に直面することがよくあります。これらすべての問題を解決できる一般的な言語モデルを確立することは困難です。


大規模な業界言語コンピューティング モデルには、これらの問題を解決する上でより多くの利点があり、通常、一般的なインテリジェンスと知識、業界の課題を解決する能力、大規模モデルとフルリンクの包括的な対話テクノロジ機能の間の連携という 3 つの基本的な機能を備えています。 . より良いユーザーエクスペリエンスを確保します。


一般的な知性と知識


一般的な知能と知識能力には、主に状況理解、指示学習、思考連鎖推論、常識的な質疑応答、コンテンツ生成、数学的計算、コード生成などが含まれます。DFM-2 は、C-EVAL、CMMLU、MMLU、AGIEval、Gaokao およびその他の一般知識評価、および DialogZoo の対話理解および生成タスクの標準評価において、トップの地位にランクされています。

現場では、Aspire は常識クイズ、コンテンツ生成、数学的計算、コード生成などの DFM-2 の一般的なインテリジェンス機能をデモンストレーションしました。


業界への挑戦力


Aspire はシナリオベースの実装に重点を置き、豊富な市場経験を蓄積してきました。モノのインターネットの分野を例にとると、インテリジェント端末は、さまざまなコンピューティング能力、分散した要件、複雑なシナリオ、多くのカスタマイズの必要性、および完全なインタラクティブなエクスペリエンスに対する高い要件という特徴を備えており、一般的な人工知能には困難であると判断されます。シーンに着陸を適用するテクノロジー。Aspire は、一般的な人工知能テクノロジーに基づいて、大規模なカスタマイズ機能と製品の標準化機能の開発と改善を継続し、顧客が「何千人もの人々と顔」に合わせてパーソナライズされた音声インタラクション ソリューションを独自に構築できるようにサポートし、「人間性」を実現します。コンピュータ口頭対話システム「フレキシブルバッチ製造」。


業界の課題に積極的に対応する能力は、産業アプリケーションを推進する鍵となります。これには、主に専門分野の移行、個人化された知識とスキルのカスタマイズ、小型化と低コストの導入、フルリンクの低遅延インタラクション、継続的な更新と進化が含まれます。プライベートモデルやマルチモダリティパーセプションテクノロジー連携などの機能を提供します。

現段階では、業界の着陸課題に対応して、DFM-2 は人間とコンピューターの言語対話の 5 つのコア機能を改善しました。

(1) 外部情報源によって強化された正確な推論と意思決定により、より複雑、より正確、よりリアルタイムな情報サービスをユーザーに提供できます。

(2) 深い認知に基づく一般的な意味理解により、製品の口頭理解能力とインタラクションの正確性が効果的に向上します。

(3) 文書理解に基づく信頼性の高いアクティブナレッジ質疑応答。DocDFM に基づいて文書を分析し、販売後の顧客サービスや法律相談などのサービスをユーザーに提供できます。

(4) ユーザー指向の複数個人間の対話、単一デバイスでの複数の役割のサポート、柔軟な切り替え、差別化されたサービスの提供。

(5) 複雑なタスクの自動計画と実行に直面して、ロボットによって実行されるタスクは大規模なモデルを通じて分解および計画でき、各ステップの制御コードを生成してロボットが対応するタスクを完了できるようにすることができます。


大型モデル技術連携

大規模なモデルと会話言語テクノロジーの連携により、ユーザーに優れたエクスペリエンスをもたらすことができます。Spiech フルリンク対話システムの独自技術は常に革新を続けており、技術連携の強固な基盤を築いています。 

現場では、Yu Kai氏が個人的なイメージに基づいたデジタルヒューマンをデモンストレーションし、自然シーンのデジタルヒューマン生成技術をデモンストレーションし、小規模データモデルのトレーニングを通じて高品質のデジタルヒューマン生成を実現しました。同時に、Yu Kai 氏は、彼の音声データに基づいてトレーニングされた広東語と英語の合成音声もデモし、パーソナライズされた対話生成と音声合成モデルがシームレスに組み合わされて、自由に対話できるパーソナライズされたデジタル イメージを構築しました。


音声合成の分野では、Aspire は生成拡散モデルに基づいたゼロサンプルの高品質音声編集をサポートしています。同時に、高音質音声合成マイグレーション技術により、百人一声の臨場感の高い音声再生を実現します。

すべては成長します: B エンド市場を目指し、産業アプリケーションを強化します

Yu Kai 氏は、「基本的な AI テクノロジーのイノベーションは最終的に業界に導入される必要があり、シーン アプリケーションと組み合わせることで価値が高まります。大規模モデルは産業デジタル化の重要な実現要因になります。大規模モデル + 言語コンピューティングは新世代の対話として機能します」と述べました。ユーザー インターフェイス (DUI) は産業アプリケーションに力を与えます。」市場の個々のニーズにさらに応えるために、Aspire は DUI プラットフォームと DFM-2 大型モデルを組み合わせて DUI 2.0 を開始し、会話型 AI フルリンク テクノロジーのアップグレードを完了し、徹底的な産業アプリケーションを推進しました。

現場では、Yu Kai 氏が DFM-2 アップグレードに基づいたさまざまな分野での DUI 2.0 の適用をデモンストレーションしました。


●スマートカー分野

SPEECH カー音声アシスタントの Tianqin システムは 6.0 に完全にアップグレードされ、シーン全体でマルチモーダル、マルチインテント、マルチサウンド ゾーン、およびマルチラウンドの連続対話をサポートします。

●スマートホーム分野に

この製品ソリューションには、論理的推論能力、複雑な意図を伴う対話インタラクション、読解力、コピーライティングなどを備えたインテリジェントなバトラーサービスなどの機能が追加されています。

●行政サービス

この製品ソリューションは、政府文書の読解と理解に基づいた複数ラウンドの質疑応答とインテリジェントなアシスタント機能を追加し、政策協議、ビジネス処理、公式文書生成、ビジネス回覧などの機能をサポートします。

●医療健康分野

新たに追加された専門の現場担当者、インテリジェントな相談、感情豊かな音声合成により、オンライン相談がより共感的なものになります。

●科学研究分野

Aspire ソリューションは、文献知識の質問応答、要約生成、分野文献レビュー、材料特性予測などの機能をサポートします。


業界アプリケーション紹介セッションでは、Yu Kai 氏が Spies が自社開発したカンファレンス オフィス ソフトウェアおよびハードウェア製品を盛大に紹介し、製品ディレクターの Wang Yanlong 氏がその場で詳細な紹介を行いました。その中で、ソフトウェア製品「Maier Huiji」は大規模モデル技術のサポートにより完全にアップグレードされ、AIサマリー、To-Do、テキスト研磨、ワンクリック製図などの機能が追加され、ユーザーによりスマートなオフィス体験をもたらします。 。ハードウェアに関しては、王延龍氏は大型、中型、小型、超小型の異なる製品マトリックスの導入に重点を置き、その中でAI文字起こしマイクスピーカーM6はAI指向性ピックアップとAI双方向ノイズを初めて応用した製品である。 AI トランスクリプションをオンにする; AI 追跡双眼音声カメラ C60 には複数の AI 追跡モードがあり、さまざまな会議シナリオのニーズを満たすために AI 音声によって制御できます。


Yu Kai 氏は、「Aspire は今後もアプリケーション シナリオを深化させ、業界の問題を解決し、産業の発展を促進していきます。DFM-2 の大規模モデルの機能と関連する技術的成果に基づいて、パートナーの製品と深く統合していきます」と述べました。独自のシナリオを使用して、より業界固有の機能を作成し、専用モデルにより何千もの業界に力を与えます。

Jumeng Galaxy: パートナーと協力してより良い未来を創造しましょう

この記者会見には、Apex の有力パートナーの多くが現場に出席し、Jiadu Technology、SAIC-GM-Wuling、Hezhong New Energy、Robam Electric の顧客代表が素晴らしいテーマの共有を全員にもたらしました。

現場では、AspireとMercedes-Benz、SAIC-GM-Wuling、Great Wall Motors、Hezhong New Energy、PATEO Internet of Vehicles、China Unicom Smart Network、Jiadu Technology、Hisense、Robam、Haier、Changhong Meil​​ing、その他のパートナーが署名しました。式典が行われました。今後、Aspireとそのパートナーはそれぞれの利点を最大限に発揮し、DFM-2大型モデルを中心とした新たな協力の方向性と内容を模索し、両社製品の市場競争力とブランド影響力を継続的に強化していく。

最後に高世星氏は、帰国子女起業家として、また蘇州工業団地に根ざしたテクノロジー企業として、第一に、アスパイアはテクノロジー産業で国に貢献するという初志を常に堅持しており、この初志を貫いてきたと述べ、今後への期待を3つ挙げた。決して変わっていません。第二に、Aspire は技術革新の源泉を堅持し、産業応用を促進し続けます。第三に、テクノロジー企業の自己改善は、産業の発展を促進し、我が国の国際的な影響力を高めるために非常に重要です。

テクノロジー企業は自らの運命を国民経済、国家運命と結びつけ、政府の委託を念頭に置き、実体経済に力を与え、産業の発展、技術の進歩、国家の進歩を促進しなければならない。将来的に、Aspireはプラットフォーム技術と大規模言語モデルの利点を最大限に活用し、政策の指導の下、「言語コンピューティングのための国家新世代人工知能オープンイノベーションプラットフォーム」を構築し、革新的な技術の開発を改善していきます。科学研究成果の変革を促進し、業界全体の競争力を向上させ、強力なイノベーションクラスターを支える力に成長するよう努めます。

おすすめ

転載: blog.csdn.net/m0_73135814/article/details/131700156