NERの研究ノート - LTPを使用

免責事項:この記事はブロガーオリジナル記事です、BY-SAの著作権契約、複製、元のソースのリンクと、この文を添付してくださいCC 4.0に従ってください。
このリンクします。https://blog.csdn.net/xuewenstudy/article/details/85028173
        NER(固有名詞抽出には、NERをいう。)特別な意味を持つテキストエンティティを識別するために使用されます。私たちは、次の3つのカテゴリ(エンティティクラス、授業時間とクラス番号)と7つのサブカテゴリ(名、組織名、地名、時刻、日付、通貨、および割合)に分けることができるエンティティを識別する必要があります。

        この記事では、名前付きエンティティ認識LTPの使用を記載しています。

1、取り付けアセンブリLTPパイソン

(1)pyltpのインストール:

pyltpをインストールするPIP

(conda-pythonのサポートされていません)

(2)言語モデルライブラリをデプロイします。

ダウンロードリンクします。http://ltp.ai/download.html

図に示す抽出した後。

 

CWSは、NERは、エンティティ認識モデルと命名され、中国語の単語のセグメンテーションモデルであるpaeserモデルを解析している、POSは、POSタグ付けモデルです。

2、名前付きエンティティ認識LTP

(1)コード:

輸入SYSの
輸入OS
pyltpのインポートから*

=送ら「東欧ルーマニアの首都ブカレスト、国際的な都市である。」
言葉= sent.split(「」)

= Postaggerのpostagger()
postagger.load( "D:\\プロジェクト\\ \\ \\ pos.model NLP ltp_data_v3.3.1")#インポート音声タギングモジュール
postags = postagger.postag(ワード)

= NamedEntityRecognizerレコグナイザ()
recognizer.load( "D:\\ ltp_data_v3.3.1プロジェクト\\ \\ \\ ner.model NLP")#インポート固有表現認識モジュール
netags = recognizer.recognize(単語、postags)

単語のために、postag、ジップでnetag(単語、postags、netags):
    プリント(ワード+ '/' + postag + '/' + netag)

(2)実行結果:

 

Wordは、「/」区切り、「O」によって適切な名前の音声認識は、非適切な名前を意味し、「S-Nsが」名前を表します。

参考文献:

鄭潔、「NLP中国の自然言語処理の理論と
実践」----------------
免責事項:この記事は元の記事CSDNブロガー「xuewenstudy」であり、BY-SA CC 4.0に従ってください著作権契約、再現は、オリジナルのソースリンクと、この文を添付してください。
オリジナルリンクします。https://blog.csdn.net/xuewenstudy/article/details/85028173

 

おすすめ

転載: www.cnblogs.com/jfdwd/p/11468795.html