StanfordNLPのインストールと設定

はじめに1. StanfordNLP

スタンフォードNLPは、自然言語解析ツールの範囲を提供しています。それは関係なく、会社名や名前の単語の基本形、品詞、など、日付の形式、時間、数量を与えることができ、同じエンティティ名にそのポイントを示す、文の構造、構文や単語依存をマークするために、その上気分、関係抽出冒頭陳述などを示しています。
1. Anは言語解析ツールを統合し、
高速で信頼性の高い任意のテキストの2分析;
; 3、全体的な品質のテキスト分析
一般的な言語をサポート4.;
5.より多くのプログラミング言語は、インタフェースを使用します。
6. Webサービスの容易な導入を促進します。

インストール2.

PythonのバージョンがインストールさスタンフォードNLP

  1. インストールスタンフォードNLP自然言語処理パッケージは:PIPはstanfordcorenlpインストール
    2)をダウンロードスタンフォードCoreNLPファイル
    https://stanfordnlp.github.io/CoreNLP/download.html
    3)中国のモデルのjarパッケージをダウンロードし、http://nlp.stanford.edu/ソフトウェア/スタンフォード-中国corenlp-2018-10-05- models.jar
    ここに画像を挿入説明
    。4)スタンフォード-中国corenlp-2018-10-05-ダウンロード models.jarは
    、変更をアンパックスタンフォードCoreNLPフォルダを配置名前のフォルダstanfordnlpスタンフォードCoreNLP(オプション)
  2. プリインストールjdk1.8、及び構成Javaパス。Javaパスは、入力コマンドは、Java -version通常の時刻表示、Javaでcmdをすることを確実にするために、システムのPATHとJAVA_HOME変数に追加します。
    注:あなたはjdk1.8と設定環境変数、実行stanfordNLP時間が与えられていない場合は
    ここに画像を挿入説明Pythonで6)参照モデル:
    stanfordcorenlp StanfordCoreNLPから•インポート
    •NLP = StanfordCoreNLP(r'path 'LANG =' ZH「)
    例えば:
    NLP = StanfordCoreNLP(R '/ホーム /クオ/ NLP /モジュール/ stanfordnlp /'、LANG = 'ZH')

3. StanfordCoreNLP

  1. いくつかの単語(word_tokenize)、POSタグ付け(pos_tag)、固有表現認識(NER)、構文依存関係の分析(dependency_parse)、パース(パース)の文
#-*-encoding=utf8-*-
from stanfordcorenlp import StanfordCoreNLP
import logging

nlp = StanfordCoreNLP(r'F:\ProgramFiles\module\NLP\stanfordnlp', lang='zh')
sentence="清华大学位于北京。我要考上这个大学!"
print(nlp.word_tokenize(sentence))
print(nlp.pos_tag(sentence))
print(nlp.ner(sentence))
print(len(nlp.ner(sentence)))
print(nlp.parse(sentence))
print(nlp.dependency_parse(sentence))

ここに画像を挿入説明

音声タギング(pos_tag)、固有表現認識(NER)へ2)テキスト

from  stanfordcorenlp import StanfordCoreNLP
nlp=StanfordCoreNLP(r'E:\stanford_nlp',lang='zh')

fin=open('news.txt','r',encoding='utf8')
fner=open('ner.txt','w',encoding='utf8')
ftag=open('pos_tag.txt','w',encoding='utf8')
 
for line in fin:
    line=line.strip()
    if len(line)<1:
        continue
    
    fner.write(" ".join([each[0]+"/"+each[1] for each in nlp.ner(line) if len(each)==2 ])+"\n")
    ftag.write(" ".join([each[0]+"/"+each[1] for each in nlp.pos_tag(line) if len(each)==2 ]) +"\n")
fner.close()
ftag.close()

リファレンス

https://blog.csdn.net/lizzy05/article/details/87483539
https://blog.csdn.net/wanzi_antang/article/details/103938708

リリース7件のオリジナルの記事 ウォンの賞賛1 ビュー500

おすすめ

転載: blog.csdn.net/qq_40247920/article/details/104433920