機械学習データセットの半自動アノテーション生成プロセス

機械学習用のデータセット、特に画像データセットの作成は非常に面倒に感じるかもしれませんが、この記事ではアノテーションのプロセスを簡素化するためのアイデアを紹介します。

1. データ セットを収集し、データ セットをクリーンアップします。
2. データ セットの一部に手動でラベルを付け
ます。 3. ラベル付きデータ セットを独自のモデルでトレーニングします。
4. モデルを使用してラベルのないデータを予測し、予測ファイルを出力します
。 5. 予測されたデータを再構築します。データ 注釈ツールをインポートし、手動で調整する

ここに画像の説明を挿入します
次に個人的に便利だと思ったCVATというアノテーションツールを紹介します。

1. 注釈の種類
バウンディング ボックス - 認識追跡タスク
ポリゴン - セグメンテーション タスク
ポリライン
ポイント - 注釈の姿勢推定に使用
ここに画像の説明を挿入します
2. 注釈の形式
COCO、PASCAL VOC、YOLO... などの複数のデータ形式の便利なインポートおよびエクスポートをサポートします。

3. アノテーション補助ツール
(1) エッジ吸着
ここに画像の説明を挿入します
(2) 明るさ調整
ここに画像の説明を挿入します
(3) トラッキング
ここに画像の説明を挿入します
4. チームアノテーション
(1) メンバー管理:メンバー登録、グループ管理
(2) プロジェクトタスク管理:プロジェクト追加、タスク配布

5. 関連リンク
CAVT 中国語ユーザーガイド: https://blog.51cto.com/u_14691718/5063951
英語公式ドキュメント: https://openvinotoolkit.github.io/cvat//docs/
プロジェクト github アドレス: https://github .com/openvinotoolkit/cvat

おすすめ

転載: blog.csdn.net/qq_41776136/article/details/125715796