データ駆動型 AI テクノロジー: 企業の迅速な変革とアップグレードを支援する方法

オープンソースの中国コミュニティチームは、共有の名のもとに、オープンソースの中国コミュニティの背後にあるストーリーを伝える初のライブブロードキャストを行いました。」

遠い先史時代、私たちの祖先は焼畑農業を通じて自然との対話を開始し、また人類文明の進歩の重要な基礎となる道具の誕生を発表しました。

一見シンプルだが奥深い存在である道具は、誕生以来人類の運命と密接に関わってきました。初期の石器や木の棒から、後の青銅器や鉄器、そして今日のハイテク製品に至るまで、道具のあらゆる進化は人類の生産性の飛躍を示し、社会文明の進歩を促進します。それらは人間の手の延長であるだけでなく、知恵の結晶であり、自然を征服し世界を変えるための武器でもあります。

AI ツール: 企業の迅速な開発のための強力なツール

現在を振り返ると、AI はテクノロジーの世界で輝かしいスターとなり、AI ベースのアプリケーションが雨後の筍のように出現しています。ますます「賢く」なります！

ただし、多くの伝統的な業界にとって、AI を日常業務に統合することは容易ではなく、技術的な敷居が高く、シーンの統合についてはまだ深く検討する必要があります。したがって、彼らは使いやすく、効率的で実用的な AI ツールを入手することをより熱心に望んでいます。

Amazon クラウドテクノロジー大中華圏製品部ゼネラルマネージャー、Chen Xiaojian 氏

「データベース構築における Amazon クラウドテクノロジーの 3 つのコア機能は、基本的なモデルのトレーニングから生成 AI アプリケーションの構築までの重要なシナリオをカバーしており、企業が大量のマルチモーダルデータを簡単に処理し、基本的なモデルの機能を向上させるのに役立ちます。現在、Amazon クラウドテクノロジーは開発中です。さまざまな業界のあらゆる規模の企業が強力なデータベースを構築できるよう支援しながら、ユーザーのビジネスとデータのセキュリティを確保し、データの固有の価値を基本モデルと生成 AI アプリケーションに割り当て、企業のビジネスの成長を加速します。」これをエンタープライズアプリケーションと組み合わせると、Amazon Cloud Technology Greater China 製品部門のゼネラルマネージャーである Chen Xiaojian 氏は次のように解釈しました。

AI の力を活用してビジネス開発を促進するには、データ基盤に加えて、企業が独自のアプリケーションシナリオに基づいて適切な AI ツールを選択する必要があることは明らかです。 Perplexity は、従来の検索、顧客データ、大規模な言語モデルの推論およびテキスト変換機能を融合することで独自の価値を生み出す企業の一例です。同社は、2022 年 12 月の発表以来、世界初の会話型応答エンジンを構築しており、その Web サイトとモバイルアプリケーションはすぐにユーザーの支持を集め、月間アクティブユーザー数は 1,000 万人に達し、11 月だけで 5,300 万人のビューを獲得しました。この急速な成長は、従来のマーケティング手法では匹敵しません。

さまざまなアプリケーションシナリオに対処する 3 つの方法

Chen Xiaojian 氏は次のように述べています。企業独自のデータを生成 AI アプリケーションに統合する方法を検討したとき、データを大規模な言語モデルと組み合わせることができる、検索拡張生成 (RAG)、微調整、継続的事前トレーニングという 3 つの方法を発見しました。業績を向上させるため。

生成 AI では、高品質の出力は多くの場合、大量のコンテキスト情報に依存します。企業は、独自のナレッジベース (データベースやその他のナレッジドキュメントなど) を生成 AI と組み合わせて、上向き検索やその他の方法を通じて大規模な言語モデルに補助機能を提供できます。このアプローチは比較的シンプルであり、多くの企業がすでにそれを使用してアプリケーションを構築しています。これは検索拡張生成 (RAG) です。

微調整手法には、特定のタスクにおけるモデルのパフォーマンスを向上させることを目的として、特定のターゲットタスクに関連付けられたデータを使用したモデルの追加トレーニングが含まれます。微調整の難しさは、事前トレーニングと RAG (検索拡張生成) の間にあります。文字理解、入力内容解析、出力形式制御など、さまざまなシーンに適しています。

継続的な事前トレーニングにはしきい値が高く、大量のデータが必要です。企業は、ビジネスの変化に適応するために、日々のビジネスで生成されたデータをトレーニング用の大規模モデルに継続的に入力する必要があります。トレーニング環境を最初から構築するのではなく、既存の大規模モデルに基づいて継続的な事前トレーニングが行われます。

Amazon Cloud Technology の Amazon Bedrock 製品には、多くの顧客がビジネス環境でカスタマイズされた大規模モデルをトレーニングするために使用している 3 つの主要な機能が実装されています。モデルに焦点を当てるということは、ビジネスの結果に焦点を当てることを意味し、強固なデータ基盤が成功の鍵となります。したがって、Amazon クラウドテクノロジーには、データもモデルも存在しないという重要な観点があります。

AI アプリケーションの基礎: データストレージ

AI 時代では、ストレージソリューションは大量のデータを運ぶだけでなく、十分なパフォーマンスを提供し、コストを制御できる必要があることがわかります。マルチモーダルモデルの人気により、データタイプの規模と形状は大きく異なるため、強力なデータストレージ機能が必要になります。

Chen Xiaojian 氏は、Amazon S3 は Amazon Cloud Technology によって開始された最も初期のデータストレージクラウドサービスであると述べました。ベースモデルの微調整や事前トレーニングのためのデータストレージ要件を完全に満たすプラットフォームに進化しました。 Amazon S3 は 200 兆を超えるオブジェクトを保持し、1 秒あたり 1 億を超えるリクエストを処理します。また、データのセキュリティと合法的な使用を確保するための、きめ細かい制御、コンプライアンス監査機能、ライフサイクル管理機能も提供します。 Amazon S3 は、データレイクを構築するのにも理想的な選択肢です。Amazon クラウドテクノロジーには 200,000 を超えるデータレイクアプリケーションがあります。

Amazon S3 は、効率的かつ経済的な大規模データ分析をサポートでき、人工知能、機械学習、ハイパフォーマンスコンピューティングなどのさまざまなアプリケーションシナリオに適しています。生成型 AI の時代には、データストレージと処理パフォーマンスに対する需要が高まっています。この需要に応えるために、Amazon Cloud Technology は、10 ミリ秒未満の高速アクセスを可能にする新しいサービスである Amazon S3 Express One Zone も開始しており、多くのお客様がこのサービスを自社のビジネスと合わせてすでに導入しています。

AI 時代、サーバーレスアーキテクチャは企業の急速な成長を支援します

最新のデータ処理環境では、リレーショナルデータベースはベクトル検索機能の 1 つのオプションにすぎません。検索機能の普及に伴い、リレーショナルデータベース、キーバリューデータベース、グラフデータベース、文書データベースなどのさまざまなデータベースがそれぞれの分野で重要な役割を果たしています。ただし、ベクトル検索に関しては、特にまったく新しいベクトルデータベースを導入すると、学習コスト、新しいリソースの構成コスト、およびデータ移行の複雑さが発生する可能性があります。

現在の観察では、多くの顧客は、まったく新しいデータベースシステムを導入するよりも、ベクトル検索機能を既存のデータベースに統合することを好みます。この利点は、追加の学習コスト、移行コスト、および発生する可能性のあるライセンス料が回避されることです。同時に、データの集中ストレージと管理により、応答時間が短縮され、パフォーマンスが向上します。

特に GenAI (生成人工知能) の時代では、迅速な立ち上げと市場獲得が多くの企業の主な目標となっています。したがって、さまざまなデータベースにベクトル検索機能を提供することが特に重要になります。これにより、顧客のパフォーマンスのニーズを満たすだけでなく、データの統合管理と効率的な取得が保証されます。

さらに、迅速な開発と導入のニーズが高まる中、柔軟性とコスト効率の点でサーバーレス (サーバーレス) アーキテクチャソリューションが好まれています。運用保守や DBA 作業を担当する専任担当者がいない企業にとって、サーバーレスソリューションを使用すると、将来のパフォーマンスのニーズを予測したり、面倒な運用保守作業を実行したりする必要がありません。ビジネスのピーク時には需要に合わせて自動的に拡張でき、ビジネスがアイドル状態のときにはリソースを自動的にリサイクルしてコストを節約できます。

したがって、現段階の顧客にとって、さまざまなデータベースに対するベクトル検索機能とサーバーレス機能を提供することが、迅速な開発と展開のニーズを満たすための鍵となります。これにより、データ処理の効率が向上するだけでなく、運用と保守のコストと複雑さが軽減され、企業は熾烈な競争市場で優位に立つことができます。

AIアプリケーションの実装に関しては、Amazon Musicは高度なテクノロジーを使用してユーザーと曲の特徴を分析し、その情報をベクトルに変換することで、音楽レコメンドの精度を向上させます。 Amazon OpenSearch を使用することで、Amazon Music は 1 億曲をベクトルに変換し、それらをインデックス化し、リアルタイムの音楽推奨サービスを世界中のユーザーに提供することに成功しました。

現在、Amazon Music は Amazon OpenSearch で 10 億 5,000 万のベクトルを維持しており、1 秒あたり最大 7,100 のクエリを処理する能力を備えており、レコメンデーションシステムの運用を効果的にサポートしています。

生成 AI の構築は簡単ではなく、フライホイール構造に似ており、その開発を促進するには好循環が必要です。これを実現するには、企業は複数のクラウドサービスを活用して強固なデータ基盤を構築する必要があります。このようにして、企業は大量のデータを基礎となるモデルと効率的かつ安全に組み合わせて、エンド顧客のニーズを満たし、より多くのデータを生成する独自の価値を持つ生成 AI アプリケーションを作成できます。

これらのアプリケーションが使用されると、新しいデータが生成され、モデルの精度がさらに向上します。継続的な微調整や事前トレーニングを通じて、モデルはよりスマートになり、より業界プロフェッショナルになり、ユーザーにより良いエクスペリエンスを提供できます。この正のフィードバックメカニズムの継続的なループは、企業に継続的なパワーをもたらし、ビジネスの継続的な成功を促進します。

データ駆動型 AI テクノロジー: 企業の迅速な変革とアップグレードを支援する方法

おすすめ