Amazon SageMaker レビュー


(声明: この記事は、Amazon クラウド テクノロジー開発者コミュニティ、Zhihu、セルフメディア プラットフォーム、サードパーティ開発者メディアなどの Amazon クラウド テクノロジー公式チャネルを含むがこれらに限定されない、
Amazon クラウド テクノロジーの公式記事の権利を転送および書き換える権限を与えます。 )

1 はじめに

2023 年の Amazon Cloud Technology re:Inventでは、 Amazon SageMakerの 5 つの新機能がリリースされました。これは、大規模な言語モデルやその他の基本モデルの構築、トレーニング、デプロイメントを加速し、ユーザーがモデル開発とアプリケーションのデプロイメントをより迅速に実行できるようにすることを目的としています。強力なツールとリソース。この製品の新機能を実際に体験してきましたので、以下にその体験と感想を詳しく記載します。

Amazon Cloud Technology Web サイトを開いて検索し、Amazon SageMakerこの機能のメイン ページに直接アクセスします。この関数を初めて使用する初心者としては、以下の図 1-1 に示すように、参考ドキュメントが公式チュートリアルであるため、コードなし (コードを記述せずに機械学習予測を生成する ML) を選択しました。チュートリアルは非常に詳細で、各ステップが示され、スクリーンショットが撮影されます。ただし、いくつかのスクリーンショットや一部の機能の操作は実際のインターフェースと一致していません。詳しくは後ほど説明します。次に、この機能をビルドしてこの機能を体験していきます。ドメインについて説明し、私の経験を少しお話します。

ここに画像の説明を挿入します

2 機能体験

2.1 ドメインの構築

ドメインを構築するときにスクリーンショットを撮るのを忘れましたが、メインインターフェイスに入ると、右側に非常に目を引く「個人ドメインの構成」があり、選択できます。ボタンは黄色で、視覚的に確認できます。クリックすると、SageMaker図 2-1 に示すように、ドメインが自動的に構築されます。10 分ほど待つと、構築が完了し、次に進むことができます。データのインポートなどの次のステップに進みます。

図 2-1

2.2 データセットのアップロード

構築が完了したら、検索しSageMaker Canvasてメインページに入り、図 3-1 のボタンをクリックする"Launch SageMaker Canvas"と自動的に構築されますSageMaker Canvas

図 3-1

図 3-2 に示すように現在作成中のため、メイン ページ (図 3-3) に入るまでに 15 分ほどかかります。

図 3-2


チュートリアルによると、次のステップは、データをアップロードした後に ML モデルを構築、トレーニング、分析することです。ここでは、公式チュートリアルで 2 つのデータをダウンロードしproduct_descriptions、 S3 コンソールを検索して入力し、作成されたデフォルトのバケットshipping_logsを入力します。SageMaker Canvasそして、ダウンロードしたばかりのデータをアップロードします (図 3-4)。


図 3-5 と図 3-6 は、それぞれアップロードと成功したアップロードのスクリーンショットを示しており、後続の操作でデータ セットにアクセスできます。データアップロードの応答速度も非常に速く、比較的データ量が多くてもアップロードにそれほど時間はかかりません。

ここに画像の説明を挿入します

2.3 SageMaker Canvas のセットアップ

次に、公式取扱説明書との相違点がいくつかあります。設定の準備としてキャンバスを再度開くとSageMaker Canvas、操作マニュアルには「インターフェース上で、SageMaker Canvas左ペインのDatasets(データセット)を選択し、 + Import(+インポート)を選択してください」と書かれていますが、ページを開いた後、左のウィンドウにグリッドが表示されました。が見つからなかったので、図 4-1 に示すページをDatasets選択し、データをインポートするページを選択しましたが、私のページにはボタンがなく、ボタン (図 4-2) のみがありました。 I ダウンロードしたデータはフォーマットされているため、以下のプロンプトがあるため、新しいデータを作成することを選択しましたData Wrangler(Datasets"Import""Create".csvTabularTabularCSV

写真4-1

ここに画像の説明を挿入します
次に、操作マニュアルに従って、Data Sourceを選択しAmazon S3(図 4-3)、アップロードしたデータが含まれるフォルダーを選択します (図 4-4)。データが見つかったら、アップロードすることができます。操作は簡単で、プロンプトも明確です. 取扱説明書に従えば、この手順は簡単に完了できます。

ここに画像の説明を挿入します
操作手順では、ダウンロードした 2 つのデータセットを一緒にインポートすることを選択する必要がありますが、列数が異なるためインポートできません (図 4-5) 機能がアップグレードされたかどうかはわかりませんいくつかの制限があるため、ページに戻りData Wrangler、結合する公式データセットを直接選択しました。
ここに画像の説明を挿入します

チュートリアルによると、まずcanvas-sample-shipping-logs.csvマージページでデータを選択し、右側のコンソールにドラッグし、ファイルをクリックすると、図のように各列が可視化され、各列のデータが表示されることがわかります。分布図が描かれ、各列の青色のデータバーにマウスを移動すると、その具体的な値も表示されます(図4-6~図4-9)。大量のデータを直感的に理解できる点は、他の製品にはまだ同様の機能がなく、非常に斬新で価値があると感じました。
ここに画像の説明を挿入します

図 4-7

図4-8

次に、ProctedIdマージ列として内部結合を選択しますが、それでも失敗し、次の図 4-9 に示すエラー メッセージが表示されます。

図4-9

そこで、product_descriptions.csvデータ セットをインポートしproduct_descriptions、次にshipping_logs.csvデータ セットをインポートしshipping_logs、次に 2 つのデータ セットを結合することを選択しましたが、それでもエラー メッセージが報告されました (図 4-10)。

図4-10

マージされたデータはプレビューできないというエラーメッセージが表示されるので、エラーを無視して左下隅をクリックしImport data、名前を付けて保存しましたConsolidatedShippingData(以前に2回試しているため、ここでは(2)の区別を自動的に追加しました) (図 4-11)。

図 4-11

2.4 ML モデルの構築、トレーニング、分析

接下来就是构建、训练与分析 ML 模型了,同样,与操作手册不同的是,在左侧页面中没有找到"Models"窗格,但由于要新增一个模型,所以我选择左侧窗格中的"My models"后点击新建模型按钮(图5-1)。

図5-1

新しいモデルを選択した後、ポップアップするインターフェイスでモデル タイプを選択できます。問題が異なれば、解決および分析するには異なるモデルが必要になります。ここでは、問題には 、 、预测分析および图片分析文本分析4つのタイプがあることがわかります微调基础模型(図 5-2) これがこの機能の最大のハイライトだと私は思いますが、その理由については後の評価の章で詳しく説明します。ここで最初の予測分析を選択し、「作成」をクリックします。

図5-2

最初のステップ
では、入力データを設定し (選択)、マージしたばかりのデータセットを選択し (図 5-3)、Select dataset次のステップに進みますBuild
ここに画像の説明を挿入します


モデル構築の2 番目のステップ(構築) では、ターゲット列を選択します。つまり、予測する必要があるデータを選択します。ここでActualShippingDaysフィールドを選択します。つまり、商品が商品に到着するまでにかかる時間を予測します。目的地 (図 5-4)。SageMakerCanvas は問題の種類を自動的に推論するため (図 5-5)、時刻を検出した後、時系列予測型の問題として問題を推論しますが、顧客が知りたいのは所要時間です特定の番号。したがって、クリックした後、で必要なタイプを選択Configue modelできます"Model type"。具体的にどのタイプを選択すればよいかわからない場合は、"Model type"対応するプロンプトも にあり、このタイプによって解決される特定の問題の例が示されています。より正確にモデルを選択できるようになり、初心者にとって非常に便利でフレンドリーです。

ここに画像の説明を挿入します

同時に、いくつかの無関係なフィールドを削除し、モデルを構築することを選択できます。オプションは 2 つあります:Quick Build(快速构建)およびStandard Build(标准构建)さまざまなニーズを満たすためです (図 5-6)。大まかに予測したい場合は 15 分でモデルを構築できるクイック構築を、正確に予測したい場合はより正確なモデルを提供する標準構築を選択できます。この分類はさまざまなニーズに対応できるものであり、この機能の特別な機能でもあります。
ここに画像の説明を挿入します
結果が表示されるまで約 7 ~ 8 分待ちます。次の 3 つのページがあります:概要 (図 5-7、図 5-8)スコア (図 5-9)詳細インジケーター (図 5-10、図 5-8) 11)プレビュー ページでは、SageMaker Canvas列の影響、つまり予測されたターゲット列の各入力列の推定重要度が、左側のフィールドとそのパーセンテージとして表示されます。

図5-7

図5-8

スコア ページでは、ActualshippingDays最適回帰直線を表すグラフが表示されます (図 5-9)。

図5-9

詳細インジケーター ページには、R2平均絶対誤差 (MAE)平均絶対パーセント誤差 (MAPE)二乗平均平方根誤差 (RMSE) などのさまざまなインジケーターが表示されます (図 5-10)。また、エラーも確認できます。密度チャート(図 5-11)。

図5-10

図5-11

2.5 予測モデルの生成

次に、「予測」をクリックして予測モデルを生成します。操作マニュアルとは異なり、Automatic自動予測のために以前にマージされたデータセット (図 6-1) を選択するか、Manualデータセットを再度インポートすることを選択できます。または、予測結果を生成することもできます (図 6-3)。

図6-1

図6-2

図6-3

3 コメントと提案

ゼロからデータを予測するプロセスAmazon SageMakerは非常にシンプルで、初めての接触でも操作マニュアルに従って段階的に予測を完了できると同時に、ユーザーにとって非常に親切であると感じます。多くの操作ボタンとオプションの下にプロンプ​​トがあり、ユーザーが使用する際に混乱することがなく、操作インターフェイスが非常に明確で、ページが素早くジャンプするため、機械学習の経験がなくても大丈夫です。

機能面では、前述したように、作成するモデルの種類を選択する際に、基本モデルを微調整するオプションがあり、大規模なモデルのトレーニングでは予測に他のデータを使用するため、これがこの製品の最大のハイライトだと思います企業の担当者がトレーニングに適したデータを持っている場合、基本モデルを微調整することで、予測の精度が向上し、予測とより一致するようになります。

この製品のもう 1 つのハイライトは、モデルを構築するときに列が表示されることです。Correlation to targetこれは、モデルに対するこのフィールドの影響を判断するために使用できます。その説明に基づいて、値が負の数値の場合は、このフィールドは、モデルにマイナスの影響を与える場合でも、予測モデルには役に立たないフィールドであると理解することもでき、このフィールドの値を使用して一部のフィールドのチェックを外すことで、予測時間を短縮し、効率を向上させることができます。 (図 7-1)。

使用中に、機能バーの幅が固定されていたり、ページ上の画像が完全に表示されず、ページをズームしないと完全に表示されなかったりするなど、いくつかの小さな欠点も発見しました。製品はカスタマイズをサポートしています。ブラウザーのページが暗い色に適しており、インターフェイスがより明確になるように、背景色がより適切になります。

全体として、非常に効率的で初心者に優しい製品であり、コードを記述しなくても、ビジュアル インターフェイスを通じて機械学習の予測を行うことができます

図 7-1

おすすめ

転載: blog.csdn.net/Alita233_/article/details/135001947