単なる大規模モデルではなく、Amazon Cloud Technology が AIGC の基本機能をレイアウト

 

「大型モデルは顧客のニーズの一部にすぎず、すべてではありません。顧客はさらに幅広い基本機能も必要としています。Amazon Cloud Technology は自社開発チップ、生成 AI サービス Bedrock、および大型モデル Titan を立ち上げました。これらはすべて、 」

最近、Amazon Cloud Technology Greater China の製品部門のゼネラルマネージャー、Chen Xiaojian 氏がメディアコミュニケーション会議でこのように述べました。

4月13日、Amazon Cloud Technologyは正式にAIGCに参入し、AIGCサービスのBedrockと独自の基本モデルTitan、AIプログラミングアシスタントのAmazon CodeWhispererをローンチし、自社開発のトレーニングおよび推論AIチップをベースにした最新インスタンスが正式に利用可能になったと発表した。

AIGC の分野では、Amazon クラウド テクノロジーは基本的な大規模モデルや大規模な言語モデルを作成する強みを確かに備えていますが、それよりも強力な AIGC クラウド ベースを構築し、AIGC テクノロジーの包括性を促進する方法に重点を置いています。

AIGC 分野における Amazon クラウドテクノロジーの最近の 4 つの技術革新

クラウド上で、フルマネージドで簡単にカスタマイズできる AIGC サービス

AIGC テクノロジーの爆発的な成長に直面して、企業顧客の中核となるニーズは何でしょうか? 以前、Amazon クラウド テクノロジー データベース、データ分析、機械学習担当グローバル バイスプレジデントの Swami Sivasubramanian 氏は、署名記事の中で次のように述べています。

「顧客は現在、主なニーズを私たちに語っていました。1つ目は、高性能の基本モデルを直接見つけてアクセスすることです。2 つ目は、大規模なインフラストラクチャのクラスターを管理する必要がなく、法外なコストを追加することなくアプリケーションとシームレスに統合することです。3 つ目は、簡単に入手できることです。」基本モデルに基づいて、(多かれ少なかれ)独自のデータを使用して差別化されたアプリケーションを構築し始めました。

AIGC 分野における Amazon クラウド テクノロジーのレイアウトは、これらの中心的なニーズに基づいています。

AIGC サービス Bedrock はフルマネージド サービスであり、ユーザーは API を通じて、AI21 Labs の基本モデル、Anthropic、Stability AI、Amazon 独自の基本モデル Titan など、現在主流の AIGC 大型モデルにアクセスできます。

 現在 Amazon Bedrock でサポートされている基本モデル

"フルマネージドで簡単なカスタマイズが Bedrock 独自の強みです。ユーザーはインスタンス タイプ、ネットワーク トポロジ、エンドポイントなどのインフラストラクチャの詳細を心配する必要はありません。同時に、ユーザーは少数の数 (最低 20) を指定するだけで済みます。 ) Amazon S3 のラベル付きインスタンスの特定のユースケースに合わせて、Bedrock の基本モデルをカスタマイズします。」と Chen Xiaojian 氏は述べています。

基本モデル Titan には、2 つの新しい大規模言語モデルが含まれています。その中で、Titan Text は、要約の作成、ブログの作成、テキストの分類、対話と情報の抽出などの生成的な NLP タスクに焦点を当てており、 Titan Embeddings は、テキスト入力を埋め込みコードに変換できる検索やパーソナライゼーションなどに使用されます。検索結果はより関連性が高く、状況に応じたものになり、同様のテキスト埋め込みモデルが Amazon.com の商品検索ですでに使用されています。

AIプログラミングアシスタントCodeWhispererは、すべての個人開発者に無料で公開されており、Python、Java、JavaScript、TypeScript、C#に加えて、Go、Kotlin、Rust、PHP、SQLなど10の新しい開発言語をサポートしています。CodeWhisperer は開発者の生産性を大幅に向上させ、プレビュー期間中にタスクの完了速度を 57%、タスクの成功率を 27% 向上させます。

「私たちは生成 AI が開発者にとって大きな変革をもたらすと信じています。そのため、できるだけ多くの人がそれを利用できるようにしたいと考えています」とスワミ氏は述べました。

「開発者は、コメントを通じて CodeWhisperer と対話できます。通常、コードを書くときは、自分のコードにコメントを追加します。コメントに、「クラウドに写真をアップロードするためのコードの生成を手伝ってください」と書くと、このコードが表示されます。 「すべての提案を受け入れる場合は、Tab キーを押すだけで済みます。これは、提案を受け入れるのと同じことです。このようなインタラクティブなエクスペリエンスにより、CodeWhisperer は開発者にとってスマートなアシスタントのようなものになります。」Amazon クラウドテクノロジー中華圏データテクノロジーエキスパートチームディレクター Wang 氏シャオエは言った。

 

AIGC時代、クラウド基盤のメリットを最大限に活かす

AIGC の開発のボトルネックは、コンピューティング能力が業界のコンセンサスとなっていることであり、よりコスト効率の高いコンピューティング能力が AIGC の急速な発展の基礎となっています。

今回、Amazon Cloud Technologyによりコンピューティングパワーのコストパフォーマンスがさらに向上しました。現在、Amazon Trainium チップをベースとした新しい Trn1n と、Amazon Inferentia2 チップをベースとした Amazon EC2 Inf2 インスタンスが一般提供されています。

Trainium を利用した Trn1 コンピューティング インスタンスは、他の EC2 インスタンスと比較してトレーニング コストを最大 50% 節約できます。数兆のパラメータを持つ大規模モデルの 2 週間のトレーニングを例にとると、GPU サーバー P3dn には 600 個のインスタンスが必要で、最新世代の GPU インスタンス P4d には 128 個のインスタンスが必要ですが、Trn1 には 96 個のインスタンスしか必要ありません。

Amazon Inferentia2 を利用した Inf2 インスタンスは、大規模な Transformer モデルの分散推論専用に構築された唯一のインスタンスです。前世代のインスタンスと比較して、Inf2 インスタンスは最大 4 倍高いスループットと最大 10 倍低いレイテンシを提供します。GPU ベースのインスタンスと比較して、ワットあたりのパフォーマンスが最大 45% 向上し、GPT などの大規模で複雑なモデルもサポートし、単一のインスタンスを使用して 1,750 億のパラメーター モデルの推論を実装できます。

現在、多くの大手 AIGC 企業が Amazon クラウド テクノロジーのインフラストラクチャに基づいて革新を進めています。

AIペインティングの分野では、オープンソースAIモデルStable Diffusionを立ち上げたAIGCユニコーンのStability AIは、Amazon Cloud Technology上の大規模GPUクラスターと、Amazon Trainium機械学習トレーニングチップで構成された高性能コンピューティングクラスターを使用しています。生成 AI の基本モデルをトレーニングし、クラウド上でのモデル トレーニングの弾力性を通じてコストを最適化し、最終的に、それが使用する GPT-NeoX などのオープンソース言語モデルのトレーニング時間とコストを 58% 削減します。

「現在、多くの顧客がベース モデルを実稼働環境に導入し始めたばかりであるため、ベース モデルに費やされる時間と費用は主にトレーニングに費やされています。しかし、将来、ベース モデルが大規模な導入に入ると、ほとんど将来のトレーニングと推論のためのコンピューティング リソースの需要に関して、スワミはそう言いました

最後に書きます

AIGC 分野における Amazon クラウド テクノロジーの独自の利点について、Chen Xiaojian 氏は、主なポイントが 3 つあると述べました。

まず、大規模なトレーニングと導入における顧客の困難を軽減し、AI イノベーションの敷居を下げます。

2 番目に、サードパーティ モデルや自社開発モデルなど、さまざまなモデル オプションを提供します。

3 番目に、強力なセキュリティ機能により、カスタマイズされたモデルのトレーニングおよびデプロイ時に顧客のデータ セキュリティが確保されます。

Amazon Cloud Technology では、現在の生成 AI モデルは主にテキストと画像の生成に焦点を当てており、オーディオやビデオのコンテンツ生成にも徐々に浸透しており、将来的にはクロスモーダル/マルチモーダルのコンテンツ生成がま​​すます増えていくと考えています。

「私たちは機械学習の大量導入におけるエキサイティングな転換点にいます。また、生成 AI が多くの顧客エクスペリエンスとアプリケーションを再構築すると信じています」とスワミ氏は結論付けました。

本文中の写真はPhotography Networkより引用

終わり

この記事は「Intelligent Evolution」の原著です。

おすすめ

転載: blog.csdn.net/AImatters/article/details/130433077