目次
序章:
Label Studio は、さまざまな機械学習およびディープ ラーニング プロジェクトで使用できるオープン ソースのデータ ラベル付けツールです。その主な目的は、データ サイエンティストと機械学習エンジニアがデータに迅速かつ効率的にラベルを付けて、正確な機械学習モデルを構築およびトレーニングできるようにすることです。Label Studio は、画像、テキスト、オーディオ、ビデオなどのさまざまなデータ タイプのラベル付けをサポートし、ラベル管理、注釈、チーム コラボレーション、データの視覚化と自動化など、多くの機能とツールも提供します。Label Studio は、GitHub で完全なドキュメントとコードを提供する MindsDB によって開発および管理されているオープン ソース ソフトウェアです。
1. 環境整備
pycharm を使用し、anaconda で次の環境を構成し、環境に入ります。
- Python 3.8+
- ラベルスタジオ == 1.7.1
- paddleocr >= 2.6.0.1
設定後、コンソールに入る
label-studio start
次に、Web ページ (通常はhttp://localhost:8080/ )に自動的にログインします。新規ユーザー登録
二、操作
入力後、Create Projectをクリック
適切な名前を選択し、自然言語処理を選択してから、名前付きエンティティの認識を選択します
左側のボックスで、ラベルを付けるキーワードを編集できます
[インポート] をクリックしてテキスト ファイルをインポートします。今作成したばかりです
独自の要件に従って単語にラベルを付ける
インポート後、上をクリックしてラベル付けタスクを実行します
1 つずつマークします。
最後に、マーキング後にエクスポートでき、json、csvなどを使用できます。