Dataset の COCO データセット: COCO データセットの紹介、ダウンロード、およびその使用方法に関する詳細なガイド

COCO データセットの概要


        MS COCO の正式名称は Microsoft Common Objects in Context で、2014 年に Microsoft が資金提供した Microsoft COCO データセットに由来しています。ImageNet コンペティションと同様、コンピュータ ビジョンの分野で最も関心が高く権威のあるコンペティションの 1 つとみなされています。 
        COCO データセットは、オブジェクトの検出、セグメンテーション、キャプション作成のための大規模で豊富なデータセットです。このデータセットは、主に複雑な日常シーンから取得されたシーンの理解を目的としており、画像内のターゲットの位置は正確なセグメンテーションによって調整されます。画像には、91 種類のオブジェクト、328,000 個の画像、2,500,000 個のラベルが含まれています。これまでのところ、セマンティック セグメンテーション用の最大のデータセットがあり、80 のカテゴリ、33 万枚以上の写真、そのうち 20 万枚にラベルが付けられており、データセット全体の個人数は 150 万人を超えています。

 

 公式サイトアドレス:http://cocodataset.org

0. COCO データセットの 80 カテゴリ - YoloV3アルゴリズムで使用されるデータセット

人(人)  
自転車(自転車) 車(自動車) バイク(オートバイ) 飛行機(航空機) バス(バス) 電車(電車) トラック(トラック) 船(船) 信号機(信号機) 消火栓(消火栓) 一時停止  
標識(一時停止標識)パーキングメーター(パーキングメーター)ベンチ(ベンチ)  
鳥(鳥)猫(猫)犬(犬)馬(馬)羊(羊)牛(牛)象(ゾウ)熊(クマ)シマウマ(シマウマ) )キリン(キリン)  
バックパック(リュック) アンブレラ(傘) ハンドバッグ(ハンドバッグ) ネクタイ(ネクタイ) スーツケース(スーツケース)  
フリスビー(フリスビー) スキー(スキー足元) スノーボード(スノーボード) スポーツボール(スポーツボール) 凧(カイト) 野球バット(野球バット)野球グローブ(野球グローブ)スケートボード(スケートボード)サーフボード(サーフボード)テニスラケット(テニスラケット)ボトル(瓶)ワイングラス(ゴブレット)カップ(ティーカップ)フォーク(フォーク))ナイフ(ナイフ)スプーン(  
スプーン
) ) ボウル(ボウル)  
バナナ(バナナ) リンゴ(リンゴ) サンドイッチ(サンドイッチ) オレンジ(オレンジ) ブロッコリー(ブロッコリー) キャロット(ニンジン) ホットドッグ(ホットドッグ) ピザ(ピザ) ドーナツ(スイートドーナツ) ケーキ(ケーキ)
椅子(チェア) ソファ(ソファ) 鉢植え(鉢植え) ベッド(ベッド) ダイニングテーブル(テーブル) トイレ(トイレ) テレビモニター(テレビ) ラップトップ(ノートブック) マウス(マウス) リモコン(リモコン) キーボード(キーボード) 携帯電話  
(電話)  
電子レンジ(電子レンジ) オーブン(オーブン) トースター(トースター) シンク(流し台) 冷蔵庫(冷蔵庫) 本(本) 時計(目覚まし時計) 花瓶(花瓶) ハサミ(ハサミ) テディベア(テディベア) ヘアドライヤー(
髪ドライヤー)歯ブラシ(歯ブラシ)

1. COCO データセットの重要性


        MS COCO の正式名は、Microsoft Common Objects in Context です。2014 年に Microsoft が資金提供した Microsoft COCO データセットに由来します。ImageNet コンペティションと同様、コンピュータ ビジョンの分野で最も関心があり権威のあるコンペティションの 1 つとみなされています。
        ImageNet コンペティションの廃止後、COCO コンペティションは、ターゲットの認識と検出の分野で最も権威のある重要なベンチマークとなり、また、この分野で Google、Microsoft、Facebook および多くの国内トップ企業を結集できる唯一のベンチマークでもあります。学校と優れた革新的企業が共同で参加するコンテストです。 
        このデータセットは主に、ターゲットの検出、ターゲット間のコンテキスト上の関係、2 次元でのターゲットの正確な位置決めという 3 つの問題を解決します。COCO データ セットには 91 のカテゴリがあります。ImageNet や SUN よりカテゴリは少ないですが、各カテゴリの画像数が多く、各カテゴリの特定のシーンでより多くの機能を取得するのに役立ちます。PASCAL VOC と比較して、より多くのカテゴリがあります.と画像。

1. COCOターゲット検出チャレンジ 

  • COCO データセットには 200,000 の画像が含まれています。
  • 80 カテゴリに 500,000 を超えるターゲットの注釈があり、最も広く公開されているターゲット検出データベースです。
  • 画像あたりのオブジェクトの平均数は 7.2 で、これらはオブジェクト検出の課題でよく知られたデータセットです。

 2. COCOデータセットの特徴

COCO は、大規模なオブジェクト検出、セグメンテーション、およびキャプションデータセットです。COCOにはいくつかの特徴があります:

 3. データセットのサイズとバージョン

サイズ: 25 GB (圧縮)
レコード数: 330K 画像、80 オブジェクト カテゴリ、画像あたり 5 ラベル、250,000 キーポイント。
         COCO データセットは 2 つのパートでリリースされ、前者は 2014 年にリリースされ、後者は 2015 年にリリースされました。2014 年バージョン: トレーニング画像 82,783 枚、検証画像 40,504 枚、テスト画像 40,775 枚、セグメント化された人物は 270,000 個、セグメント化されたオブジェクトは 886,000 個あります; 2015 年バージョン: 165,482 個の列車、81,208 個のヴァル、および 81,434 個のテスト画像。
(1) 2014年版のデータは、写真が合計約20G、ラベルファイルが約500Mとなります。ラベル ファイルは、各セグメンテーションの正確なピクセル位置 + 境界ボックスの正確な座標をマークし、その精度は小数点以下 2 桁です。

COCO データセットのダウンロード

公式サイトアドレス:http://cocodataset.org/#download

1. 2014 データセットのダウンロード

train2014:http://images.cocodataset.org/zips/train2014.zip
val2014:http://images.cocodataset.org/zips/val2014.zip

http://msvocds.blob.core.windows.net/coco2014/train2014.zip

2. 2017 データセットのダウンロード

http://images.cocodataset.org/zips/train2017.zip
http://images.cocodataset.org/annotations/annotations_trainval2017.zip

http://images.cocodataset.org/zips/val2017.zip
http://images.cocodataset.org/annotations/stuff_annotations_trainval2017.zip

http://images.cocodataset.org/zips/test2017.zip
http://images.cocodataset.org/annotations/image_info_test2017.zip

COCO データセットの使用方法

1. 基本的な使い方

 

 

おすすめ

転載: blog.csdn.net/asuf1364/article/details/131827710