次の形式で設定したパスカルVOC対象検出データ:
どこで:
- 画像アノテーション情報のXMLファイルの注釈
- ファイル名TXT訓練画像のセット、テストセット、検証、検証セットを訓練ImageSets
- 元の画像にJPEGImages
ダウンロード:パスカルVOCやYOLOデータ形式はlabelimgを標識するために使用することができます。
リンクします。https://pan.baidu.com/s/1r8x7tu0sdO_UUuCXKVfELQ
抽出コード:L325
非常に簡単な操作は、導入していません。
次のような優れたXMLファイルをマーク:
< 注釈> < フォルダ> JPEGImages </ フォルダ> < ファイル名> test_00000002.jpg </ ファイル名> < パス> E:\検出\パスカルVOC \ maskornot \ JPEGImages \ test_00000002.jpg </ パス> < ソース> < データベース>不明</ データベース> </ ソース> < サイズ> < 幅> 480 </ 幅> <高さ> 600 </ 身長> < 深さ> 3 </ 深さ> </ サイズ> < セグメント化> 0 </ セグメント化> < オブジェクト> < 名前>マスク</ 名前> < ポーズ>指定されていない</ ポーズ> < 切り捨て> 0 </ 切り捨て> < 難しい> 0 </ 難しいです> < bndbox > < XMIN > 112 </ XMIN > < YMIN > 7 </ YMIN > < XMAX > 352 </ XMAX > < YMAX > 325 </ YMAX > </ bndbox > </ オブジェクト> </ 注釈>
対応する画像は、次のとおりです。
;約50%のtrainvalの列車、オリジナルVOC2007データ、データセット全体の約50%をtrainvalアカウント、データセット全体の50%程度のテストに焦点を当てた:次いで、トレーニングセット、テストセット、検証セット、トレーニングの検証セットを分割valのうち約50%trainval
インポートのOS インポートランダム trainval_percent = 0.5 train_percent = 0.5 xmlfilepath = ' /コンテンツ/ドライブ/マイドライブ/ pytorch_ssd /データ/ maskornot /注釈' txtsavepath = ' /コンテンツ/ドライブ/マイドライブ/ pytorch_ssd /データ/ maskornot / ImageSets /メイン' total_xml = os.listdir(xmlfilepath) NUM = LEN(total_xml) リスト = 範囲(NUM) テレビ = INT(NUM * trainval_percent) TR = INT(TV * train_percent) trainval = = random.sample(リスト、TV) 列車random.sample(trainval、TR) ftrainval =オープン(txtsavepath + ' /trainval.txt '、' W ' ) FTEST =オープン(txtsavepath + ' /test.txt '、' W ' ) ftrain =オープン(txtsavepath + ' /列車。 TXT ' ' W ' ) FVAL =オープン(txtsavepath + ' /val.txt ' ' W " ) のための私 でリスト: 名 = total_xml [I] [:-4] +' \ nは' もし私でtrainval: ftrainval.write(名前) であれば、私で電車: ftrain.write(名) 他: fval.write(名) 他: ftest.write(名) ftrainval.close() ftrain.close () ()fval.close ()ftest.close
実行した後:
前記tranval.txt部分的な結果は次のようになります。
test_00000002
test_00000003
test_00000006
test_00000009
test_00000008
test_00000012
test_00000013
test_00000014
test_00000020
この時点で、対象検出データセットが完了し作成。
独自のデータセットを作成するためにpytorch-SSDトレーニングを使用して、次のセクション、。