ボリュームモデル技術だけでなくボリュームエンジニアリングも実現!

GPT や Llama などの大規模モデル テクノロジにおける度重なるブレークスルーは、世界の AI 業界に新たな衝撃を引き起こしました。数百の国産モデルが登場しました。科学研究​​のトップ人材は全員、モデルのパラメータとパラメータを改善する方法に焦点を当てています。モデル効果。

人工知能分野の専門家である Jia Yangqing 氏は、かつてモデルの有効期間の概念について言及し、2012 年の AlexNet のリリース以来、強力なパフォーマンスを備えた大規模なモデルがリリースされるたびに、モデルの有効期間は長くなるだろうと考えています。わずか半年から1年で、それに近い性能のモデルが登場します。

高品質な汎用大規模モデルのオープンソース化が進むにつれ、モデル間の技術的障壁はさらに解消されることが予想され、AIインフラストラクチャとモデル実装のコストをいかに削減するかが、企業、チーム、企業の関心事となるでしょう。個人の開発者。

そのためには、企業は人工知能テクノロジーを包括的に理解し、自社のインフラストラクチャや研究開発プロセスを調整、最適化し、さらには再構築する必要があります。AI インフラストラクチャの構築では、コンピューティング パワー クラスター、データ ストレージ、モデル トレーニング、推論展開の全体的なリンクに注意を払う必要があります。AI インフラストラクチャのリンクでは、既存のクラウド サービスを使用するか、民営化するオープンソース インフラストラクチャ製品を選択するかを選択できます。

高性能コンピューティング能力が著しく不足している市場環境では、堅牢で効率的な AI 研究開発基盤があれば、チームの戦闘効率を完全に向上させることができます。AIの科学的研究能力に加えて、研究開発チームが優れたエンジニアリング能力を備えられるようにすることが、AI時代において戦いに勝利し、カーブで追い越しをするための鍵となっています。

2023年8月12日午後(今週土曜日)、北京市朝陽区のロイヤルグランドスカイライトホテルにてプログラマーカンファレンス「NPCon:AIモデル技術と応用サミット - フルリンクによるAI研究開発基盤の構築」が開催される。さまざまな規模や段階の企業に適したAIインフラ構築計画を選択する方法、AIのフルリンク研究開発プロセスを効率的に改善する方法について一緒に議論しましょう

858705c991852c7084ec7d147c54e726.png

完全な議題

d7d70a6f123dcb45d1690ec45f456f05.jpeg

74170b3843cde3f11f7de76a60d8c5cd.png

ゲストとコンテンツ紹介の共有

adb65d6b79932bd073604af9e8ee4b21.jpeg

基調演説

「大規模モデルの出現、トレーニング アーキテクチャとコンピューティング チップの導入方法」

国際コンピュータ協会 (ACM) および中国コンピュータ連盟 (CCF) の専門会員であり、約 70 以上の中国および米国の発明特許を取得しており、『GPT-4 ラージ モデル ハード コア解釈』、『GPT-4 コア テクノロジ分析レポート』の著者"、"GPGPU チップ設計"

スピーチ内容:

GPT などの大規模モデル テクノロジの急速な成長と普及に伴い、LLM/MLM のオープン ソース リソース、導入トレーニング アーキテクチャ、およびコンピューティング電力コストが、大規模モデル アプリケーションの実装と企業損益の ROI の重要な分水嶺となっています。重要性はモデルの精度と同等です。このトピックでは、オープン ソースの基盤モデルと GPT およびその他の大規模モデルの Finetune、オープン ソース アプリケーション プラットフォーム、展開およびトレーニング アーキテクチャ、および展開の全体的なコストに対する GPU と DSA チップの重要な影響について共有します。 MaaS 企業の製品ビジネス設計と大規模モデル展開。

基調演説

LLM アプリケーション テクノロジー スタックとエージェントのパノラマ分析

インターネット業界で 11 年以上の経験があり、製品設計、アジャイル プロジェクト管理、DevOps、組織文化の学習、Web アプリケーション開発について深い理解を持っています。近年では、エンタープライズサービスやツールソフトウェアの分野でSaaSの製品、運用、技術管理に豊富な経験を積んでいます。

e37959ec3c7129db7deb2d7b6bdc9990.jpeg

スピーチ内容:

現在の大規模モデルアプリケーション技術スタックの全景を総括し、アプリケーション技術スタックの実現能力と解決すべき課題を整理するとともに、DifyなどのAIアプリケーションツールプラットフォームの位置付けと機能構築についても解説します。大規模モデルの生態を調査し、現在の大規模モデル技術開発とアプリケーション開発の傾向を分析します。

7973e3e507175d730deb7f8450a37753.jpeg

基調演説

Meituan Visual GPU 推論サービスの導入アーキテクチャ最適化の実践

Meituan のビジュアル インテリジェンス部門は、ソフトウェア開発エンジニアとして、主にサービス プラットフォームの開発、ビジュアル モデル展開スキームの設計、および GPU サービス パフォーマンスの最適化を担当しています。同時に、人工知能分野の最先端の進歩と応用にも非常に関心を持っており、新しいテクノロジーによってもたらされる変化を積極的に受け入れています。余暇にはサイクリングが大好きです。コミュニケーションを取り、学び、自然を探索し、サイクリングの楽しさを楽しむことを歓迎します。

スピーチ内容:

Meituan Vision は、ビジュアル AI テクノロジーを地域の生活サービスのさまざまなシナリオに適用することに取り組んでいます。しかし、オンライン推論サービスで使用される GPU リソースが増加し続けるにつれて、GPU 使用率の低下の問題がますます顕著になり、その結果、コンピューティング リソースが大量に浪費されます。実験的な分析の結果、GPU 使用率が低い推論サービスには共通の問題があることがわかりました。それは、モデル構造内で CPU オペレーターと GPU オペレーターが相互に結合されており、これが動作効率に重大な影響を及ぼしているということです。この目的を達成するために、モデル構造の分割とマイクロサービスを通じてこの一般的なパフォーマンスのボトルネック問題を解決するための、一般的で効率的な展開アーキテクチャを提案します。現在、このソリューションは Meituan の中核ビジュアル サービスに適用されており、最適化後のサービスの GPU 使用率は 100% に近くなり、サービスのパフォーマンスは 2 倍になりました。

基調演説

AI ラージ モデル コンピューティング パワー システム解析

Zhu 博士は、Inspur Information の人工知能および高性能アプリケーション ソフトウェア部門に勤務しており、大型モデルや AIGC などの最先端の AI アルゴリズムの研究開発と AI アプリケーションの実装を担当しています。

d43cb67fb57b0bea563fccc10d6164e3.jpeg

スピーチ内容:

Inspur 情報源大型モデルの作業実践とインテリジェント コンピューティング センターのコンピューティング パワー プラットフォームの構築経験を組み合わせて、現在の AI 基本大型モデルの技術トレンド、コンピューティング パワー要件、およびコンピューティング特性を共有します。業界が現在直面している技術的な課題。

eec5aa74a8a639433cb75d230669c8dc.jpeg

稲妻のスピーチ

AI アプリケーションを迅速に着陸させます

フルスタック開発者であり、有名なオープンソース プロジェクト ViewDesign (iView) の創設者です。

『Vue.js Combat』、『Vue.js Components Intensive』の著者であり、多くの Vue.js アクティビティを企画しました。

スピーチ内容:

InsCode(inscode.net)は、AIを活用し、開発・デプロイ・運用・保守・運用までの連携開発業務をワンストップで解決するアプリケーション開発サービスプラットフォームです。

「話しましょう」ラウンドテーブル

AI時代の研究開発の新たなパラダイム

開発者の能力による進化

北京航空航天大学を卒業し、第一線のソフトウェアおよびアルゴリズムエンジニアからスタートアップ企業のCTOまで。

資本市場に参入し、長年にわたりデータ&AIインフラの方向性に注力し、多くの有名新興企業にコンサルティングサービスを提供しています。

38dc6103d1b68ab1ab608780007a3239.jpeg

1a9112889944437a647aa577b1ffff7d.jpeg

「話しましょう」ラウンドテーブル

AI時代の研究開発の新たなパラダイム

開発者の能力による進化

南開大学とミネソタ大学が共同で医師を育成し、彼が率いる研究チームは推薦システム、情報検索、因果推論技術のフロンティア開拓に重点を置き、事前研究の成果を同社の30以上の製品/シナリオに導入した。 、50以上の論文を発表し、40以上の特許を申請し、ACM SIGIR、SIGKDDなどの学術団体で上級プログラム委員/プログラム委員/審査員を務め、中国語版「シンギュラリティ」を翻訳近い"。

「話しましょう」ラウンドテーブル

AI時代の研究開発の新たなパラダイム

開発者の能力による進化

北杭大学コンピューターサイエンス学部を卒業し、NLPアルゴリズムに取り組んでいます。

現在、Zhipu AI の CodeGeeX チームのアルゴリズム専門家であり、専門分野は大規模モデルのトレーニングとアプリケーションです。

4d3d9d1f0ac97f373dc4f3bb2f0b20c8.jpeg

04796dbdbeb45680e685ea2077eb5134.jpeg

「話しましょう」ラウンドテーブル

AI時代の研究開発の新たなパラダイム

開発者の能力による進化

清華大学コンピュータ サイエンスの学士および修士号を取得しており、新技術の研究開発とイノベーション管理において 10 年以上の経験があります。彼は以前、スター タイムズ メディア グループ研究所の主任アーキテクトであり、アフリカの 10 か国以上をカバーするトリプル プレイ ビデオ システムの設計と構築を担当していました。連続起業家であり、数十の国内発明特許を取得しています。 。

93651e353fc59ca6cc81e16874cc9dba.jpeg

おすすめ

転載: blog.csdn.net/dQCFKyQDXYm3F8rB0/article/details/132241755