NLP の基本: Label Studio の概要

目次

1. 環境整備

二、操作 

記事のソース:


序章: 

Label Studio は、さまざまな機械学習およびディープ ラーニング プロジェクトで使用できるオープン ソースのデータ ラベル付けツールです。その主な目的は、データ サイエンティストと機械学習エンジニアがデータに迅速かつ効率的にラベルを付けて、正確な機械学習モデルを構築およびトレーニングできるようにすることです。Label Studio は、画像、テキスト、オーディオ、ビデオなどのさまざまなデータ タイプのラベル付けをサポートし、ラベル管理、注釈、チーム コラボレーション、データの視覚化と自動化など、多くの機能とツールも提供します。Label Studio は、GitHub で完全なドキュメントとコードを提供する MindsDB によって開発および管理されているオープン ソース ソフトウェアです。

1. 環境整備

pycharm を使用し、anaconda で次の環境を構成し、環境に入ります。

  • Python 3.8+
  • ラベルスタジオ == 1.7.1
  • paddleocr >= 2.6.0.1

設定後、コンソールに入る

label-studio start

次に、Web ページ (通常はhttp://localhost:8080/ )に自動的にログインします。新規ユーザー登録

二、操作 

入力後、Create Projectをクリック

適切な名前を選択し、自然言語処理を選択してから、名前付きエンティティの認識を選択します

 

 左側のボックスで、ラベルを付けるキーワードを編集できます

 [インポート] をクリックしてテキスト ファイルをインポートします。今作成したばかりです

 独自の要件に従って単語にラベルを付ける

 インポート後、上をクリックしてラベル付けタスクを実行します

1 つずつマークします。 

 最後に、マーキング後にエクスポートでき、json、csvなどを使用できます。


記事のソース:

1. Label studio に基づくトレーニング データのラベリング ガイド: 情報抽出 (エンティティ関係抽出)、テキスト分類など - Tencent Cloud Developer Community - Tencent Cloud

おすすめ

転載: blog.csdn.net/m0_62237233/article/details/130332657