データ処理ツールボックスの概要
Pytorchにはデータ処理(データの読み込み、データの前処理、データの拡張など)が含まれます。主なツールキットとそれらの相互関係を図に示し
ます。
- Dataset:は抽象クラスです。他のデータセットはこのクラスを継承し、2つのメソッド(getitem、len)を書き換える必要があります。
- DataLoader:新しいイテレーターを定義して、バッチ読み取りを実装し、データをシャッフルし、並行加速やその他の機能を提供します。
- random_split:データセットをランダムに分割して、指定された長さの重複しない新しいデータセットにします。
- サンプラー:複数のサンプリング機能
図の中央にあるトーチビジョンは、4つのカテゴリを含むPytorch視覚化処理ツールです。
- データセット:設計でtorch.utils.data.Datasetから継承された、一般的に使用されるデータセットの読み込みを提供します
- モデル:ディープラーニングでさまざまなクラシックネットワーク構造とトレーニング済みモデルを提供します(事前トレーニング済み= Trueが選択されている場合)
- 変換:主にTensorおよびPIL Imageオブジェクトの操作を含む、一般的なデータ前処理操作
- utils:2つの関数が含まれています。1つはmake_gridで、グリッドに複数の画像をつなぎ合わせることができます。もう1つは、テンソルを画像として保存できるsave_imgです。