最近、インターネット上で、下図のようなVOCでもYOLOでもないラベル形式のターゲット検出データセットを見つけました。他に名前が見つからなかったので、まずは bbgt 形式と呼びましょう。
ラベルの紹介は次のようになります。
たった今
ラベルはPiotr の Computer Vision Matlab Toolbox ( PMT ) を使用して生成されました。
各「.txt」の形式は次のとおりです。
(a) 最初の16文字:アノテーションツールデータ(未使用)
(b) 1列目:オブジェクトクラス名
(c) 列 2 ~ 5: 境界ボックスの座標 [ltwh]
l - 画像の左端からの距離
t - 画像の右側からの距離
w - コールアウトボックスの幅
h - 吹き出しボックスの高さ
(d) 列 6 ~ 12: オクルージョンと方向に関するメモ (未使用)
(e) 複数のオブジェクトの注釈が付けられた画像の場合は、(b) ~ (d) を繰り返します。
Chatgpt を使用して BBGT 形式を yolo 形式に変換する方法を次に示します。
画像のファイル名とラベルの一貫性を保つためのコードを作成します。
各タグ ファイルの最初の行を削除するコードを記述します (% bbGt version=3)
ラベルの内容が画像の左端からの距離、画像の左端からの距離、画像の右側からのラベル ボックスの高さである txt ファイルを変換するのに役立つコードを作成します。注釈ボックスの高さを yolo 形式ファイルに変換します。画像のサイズが異なり、画像の形式は jpg、png、jepg であることに注意してください。
ようやく変換が完了し、Chatgptを数ヶ月登録して初めてその利便性と威力を実感しました。もちろん、時には「お店ネタ」もあるでしょう。
参考になりましたら、いいねや励ましをいただけると嬉しいです!ありがとう!