画像分類に関連する高品質のオープンソース データセットの概要 (ダウンロード リンク付き)

編集: エクストリーム マーケット プラットフォーム

花のデータセット

データセットのダウンロードアドレス: http://m6z.cn/6rTT7n

データセットには 4,242 枚の花の画像が含まれています。データ収集はデータ flicr、google 画像、yandex 画像に基づいています。このデータセットは、写真から植物を識別するために使用できます。データ画像は、カモミール、チューリップ、バラ、ヒマワリ、タンポポの 5 つのカテゴリにグループ化されています。カテゴリーごとに約800枚の写真が掲載されています。写真は高解像度ではなく、約 320x240 ピクセルです。写真は単一のサイズに縮小されるのではなく、異なる比率で表示されます。

包括的な自動車データセット

データセットのダウンロード アドレス: http://m6z.cn/6rTTar

このデータセットは、CVPR 2015 の論文「きめ細かな分類と検証のための大規模自動車データセット」で使用されました。Composite Cars (CompCars) データセットには、Web ナチュラルと監視ナチュラルの画像を含む 2 つのシナリオからのデータが含まれています。Web ネイチャー データには、163 の自動車メーカーと 1,716 の車種が含まれています。合計で、車両全体の画像が 136,726 枚、自動車部品の画像が 27,618 枚あります。車全体の画像には、境界ボックスと視点がラベル付けされています。各車種には、最高速度、排気量、ドア数、座席数、車種の 5 つの属性がマークされています。監視の性質を持つデータは、正面から撮影された車の 50,000 枚の画像で構成されていました。

屋内シーン認識

データセットのダウンロードアドレス: http://m6z.cn/5PCpJ5

このデータセットは MIT から提供されたオリジナル データです。屋内シーンの認識は、高レベルの視覚における挑戦的な未解決の問題です。屋外シーンのほとんどのシーン認識モデルは、屋内領域ではパフォーマンスが低下します。主な問題点は、一部の屋内シーン (廊下など) はグローバルな空間属性によってよく特徴付けられるのに対し、他のシーン (書店など) はそこに含まれるオブジェクトによって特徴づけられることです。より一般的には、屋内シーン認識問題を解決するには、ローカルおよびグローバルな識別情報を活用できるモデルが必要です。データベースには、67 の屋内カテゴリと合計 15,620 枚の画像が含まれています。画像の数はカテゴリによって異なりますが、各カテゴリには少なくとも 100 枚の画像があります。すべての画像はjpg形式です。

90 枚の動物画像のデータセット

データセットのダウンロードアドレス: http://m6z.cn/6rTTbJ

このデータセットには、90 の異なるカテゴリの 5,400 枚の動物画像が含まれています。このデータセットは Google 画像から作成されました: https://images.google.com/。すべての写真は、カテゴリに応じてそれぞれのフォルダーに保存されます。動物のカテゴリには、カモシカ、アナグマ、コウモリ、クマ、ハチ、カブトムシ、バイソン、イノシシ、蝶、ネコの
毛虫、チンパンジーなどが含まれます。このデータセット内の画像のサイズは固定されていないため、後続の処理が必要になる場合があります。

航空機データセット

データセットのダウンロードアドレス: http://m6z.cn/5X8CPy

データセットには 10,000 枚の飛行機の画像が含まれており、データは 3,334 枚のトレーニング画像、3,333 枚の検証画像、および 3,333 枚のテスト画像に分割されています。

衣服データセット

データセットのダウンロード アドレス: http://m6z.cn/64EPUp

服装データセットには、20 種類の服装の合計 5,000 枚の画像が収集されています。このデータセットはパブリック ドメイン ライセンス (CC0) に基づいてリリースされています。データセットの収集には 3 つの異なる方法を使用しました: Toloka - クラウドソーシング プラットフォーム、ソーシャル メディア上の Web クラウドソーシング イニシアチブ、Tagias - データ収集を専門とする会社。ラベル付けは IPython ウィジェットを使用して手動で行われ、ラベル付けエラーは単純なニューラル ネットワークを使用して修正されました。

データセットには、T シャツ (1011 アイテム)、長袖 (699 アイテム)、パンツ (692 アイテム)、靴 (431 アイテム)、シャツ (378 アイテム)、ドレス (357 アイテム)、コート (312 アイテム) を含む 20 クラスが含まれています。 、ショートパンツ(308点)、帽子(171点)、スカート(155点)、ブレザー(109点)など。

商標データセット

データセットのダウンロードアドレス: http://m6z.cn/6cb2HG

この作業では、現実世界のロゴ画像からさまざまなロゴ カテゴリをカバーする大規模なロゴ データセット Logo-2K+ を構築します。生成されたロゴ データセットには、10 のルート カテゴリと 2,341 のクラスを含む 167,140 個の画像が含まれています。

オフィスと自宅のデータセット

データセットのダウンロードアドレス: http://m6z.cn/5I6cFG

Office-Home はドメイン適応のベンチマーク データセットであり、4 つのドメインが含まれており、各ドメインは 65 のカテゴリで構成されています。4 つのドメインは次のとおりです: アート - 図面、絵画、装飾などの形式の芸術的な画像; クリップ アート - クリップ アート画像のコレクション; 製品 - 背景のないオブジェクトの画像; 現実世界 - 通常の画像でキャプチャされたオブジェクトカメラ画像。15,500 枚の画像が含まれており、クラスあたり平均約 70 枚の画像、クラスあたり最大 99 枚の画像が含まれます。

食品画像データセット

データセットのダウンロードアドレス: http://m6z.cn/6rdsSw

このデータセットには、完全な food-101 データのさまざまなサブセットが含まれています。CIFAR10 や MNIST よりもシンプルな画像分析用のトレーニング セットを作成するために、データには高速テスト用に大幅に縮小されたバージョンの画像が含まれています。データは、簡単に読み取ることができるように、HDF5、具体的には Keras HDF5Matrix として再フォーマットされています。ファイル名はファイルの内容を示します。例えば

foodc101n1000_r384x384x3.h5 は、101 カテゴリ、n=1000 画像、解像度が 384x384x3 (RGB、uint8) であることを示します foodtestc101n1000r32x32x1.h5 は、
データが検証セットの一部であり、101 カテゴリ、n=1000 画像を表し、解像度は 32x32x1 (f loat32 は -1 から 1)

このデータセットの最初の目標は、未知の画像を分類することですが、それを超えて、どの領域/画像コンポーネントが分類に重要であるかを確認し、既存のラベルの組み合わせとして新しいタイプの食品を識別し、シーン全体で類似のオブジェクトを見つけるオブジェクト検出器を構築します。

おすすめ

転載: blog.csdn.net/Extremevision/article/details/126470702