転移学習用の共通データセット

目次

オフィス-31

PACS

オフィス-Caltech10

MNIST+USPS


転移学習用の共通データセット

オフィス-31

Office-31 データセット は、視覚伝達学習における主流のベンチマーク データセットである Office データセット です。 . このデータ セットには、ラップトップ、ファイリング キャビネット、キーボードなど、オフィス環境にある合計 31 の一般的なターゲット オブジェクトが含まれています < a i =6>4652 画像。

これらの画像は主にAmazon (オンライン e コマース画像)、ウェブカメラ (DSLR カメラで撮影した高解像度画像)。 DSLR (ウェブカメラで撮影した低解像度画像)、

データセットには以下が含まれます。

Amazon:2817 画像、カテゴリごとの平均 90 写真、単一画像の背景

ウェブカメラ:795 枚 画像に重大なノイズ、色、ホワイト バランスのアーチファクトが見られる

DSLR:498 画像、カテゴリあたり 5 < /span>3 回 オブジェクト、それぞれ異なる視点から撮影

画像例:

PACS

PACS のデータ セットは、写真 (1670 画像)、絵画 (2048 画像)、漫画 (2344 画像)、スケッチ (3929 画像) の 4 つのドメインを含むドメイン適応画像データ セットです。各ドメインには 7 つのカテゴリが含まれています。

PACS データセット部門:

トレーニング セット: 8977 枚の写真

テストセット: 1014枚の写真

検証セット: 9991 枚の写真

オフィス-Caltech10

このウェブサイトの最初のグループ:transferlearning/data at master · jindongwang/transferlearning · GitHub

Office-Caltech-10数据集包含有2533个样本,包含(C A W D)四种数据库的数据,C(Caltech), A(Amazon在线电商图片)W(Webcam网络摄像头拍摄的低解析度图片) D(DSLR单反相机拍摄的高解析度图片),其中C1123个,A958个,W295个,D157个,数据集提供了SURF特征DeCAF特征

该数据集有10类物体,是Office-31Caltech-256数据集中相同的类:”backpack“,”bike“,”calculator“,”headphones“,”keyboard“,”laptop computer“,”monitor“,”mouse“,”mug“,”projector“。

Office-Caltech10的SURF特征和DeCAF特征:

Office-Caltech10 は広く使用されている画像分類データセットで、10 個の異なるオブジェクト カテゴリが含まれています。 5Office データ セットからのもので、 a> 特徴は、一般的に使用される特徴抽出方法です。 DeCAF機能とSURFデータセット、Office-Caltech10 データセット。 カリフォルニア工科大学 からの5

SURF特征:

SURF (高速化された堅牢な機能) 機能は、スケール スペースに基づくローカル機能です。ガウス ピラミッドを構築することで画像内の安定した特徴点を検出し、これらの特徴点に対して記述子の計算を実行します。 Office-Caltech10 データ セットでは、SURF アルゴリズムを使用できます。画像のSURF特徴をそれぞれ抽出します。

各画像内で検出されたSURFキーポイントについては、SURF< a i=4 >アルゴリズムは、周囲領域のHaarウェーブレット応答を計算し、これらの応答を使用して SURF を計算します。 記述子。各SURF記述子は、スケール、方向、およびスケールを含む64 次元ベクトルです。キーポイントと周囲のピクセルの差分情報を取得します。

使用SURFアルゴリズムによって抽出された特徴を使用して、画像内のテクスチャや形状などの低レベルの特徴を表現できます。特徴はオブジェクト分類タスクにおいて重要であり、パフォーマンスが向上します。

DeCAF特征:

DeCAF (Deep Convolutional Activation features) 機能は、畳み込みニューラル ネットワークに基づく機能です。事前トレーニングされた CNN モデル (AlexNet) 各画像に対して順伝播を実行して、高次元の特徴ベクトル表現のセットを取得します。 Office-Caltech10 データセットでは、事前トレーニングされた AlexNet モデルを使用できます。各画像のDeCAF特徴を抽出します。 AlexNetモデルには 5 つの 畳み込み層と < a i =18>3 完全に接続されたレイヤー、最終的に画像の分類確率分布を表す 1000 次元ベクトルを出力します。 。

画像ごとに、AlexNetモデルの最初の部分8 a> 次元を持ち、画像に含まれるオブジェクト、シーンなどの画像の意味情報を表すために使用できます。 。 4096 機能。この特徴ベクトルは通常、 として抽出します。 DeCAF 層の特徴ベクトルを 8層は順伝播を実行し、

より高度な特徴表現を取得するには、DeCAF 特徴抽出メソッドを使用します。これは、深層学習に基づいた特徴抽出メソッドであり、自動的に画像の特徴表現を学びます。この機能は、特に複雑な画像シーンに直面した場合に、オブジェクト分類タスクでうまく機能します。

特徴の表現:

Surf アルゴリズムによって取得される特徴点記述子は固定長ベクトルで、通常は 64 です。寸法。これらの記述子は、画像のテクスチャや形状などの低レベルの特徴を表すために使用できます。

DeCAF によって取得される特徴ベクトルは高次元ベクトルであり、通常は 4096 次元を持ちます。このベクトルは、画像に含まれるオブジェクト、シーンなどの画像の意味情報を表すために使用できます。

該当するシーン:

Surf アルゴリズムは、ターゲットの追跡や画像の結合など、画像内の安定した特徴点を迅速に検出する必要があるシナリオに適しています。

DeCAF アルゴリズムは、画像分類、オブジェクト検出、画像検索など、画像の高度な意味分析を必要とするシナリオに適しています。

全体として、SurfDeCAF は 2 つの異なる機能です抽出アルゴリズムはさまざまなアプリケーション シナリオに適しています。 Surf は低レベルの画像処理タスクに適していますが、DeCAFこれは、高レベルの画像意味分析タスクにより適しています。

MNIST+USPS

手写体数字识别数据,随机从Mnist数据和USPS数据中选取的。Mnist每张图为28*28大小,一共70000张图片,10类数字。Usps数据集图片大小为16*16,共20000张图,10类数字。

データのダウンロード Web サイトは次のとおりです。sam roweis: data

他のデータセットの参照アドレス:Zhihu Portal

おすすめ

転載: blog.csdn.net/m0_55196097/article/details/130059285