はじめに1. StanfordNLP
スタンフォードNLPは、自然言語解析ツールの範囲を提供しています。それは関係なく、会社名や名前の単語の基本形、品詞、など、日付の形式、時間、数量を与えることができ、同じエンティティ名にそのポイントを示す、文の構造、構文や単語依存をマークするために、その上気分、関係抽出冒頭陳述などを示しています。
1. Anは言語解析ツールを統合し、
高速で信頼性の高い任意のテキストの2分析;
; 3、全体的な品質のテキスト分析
一般的な言語をサポート4.;
5.より多くのプログラミング言語は、インタフェースを使用します。
6. Webサービスの容易な導入を促進します。
インストール2.
PythonのバージョンがインストールさスタンフォードNLP
- インストールスタンフォードNLP自然言語処理パッケージは:PIPはstanfordcorenlpインストール
2)をダウンロードスタンフォードCoreNLPファイル
https://stanfordnlp.github.io/CoreNLP/download.html
3)中国のモデルのjarパッケージをダウンロードし、http://nlp.stanford.edu/ソフトウェア/スタンフォード-中国corenlp-2018-10-05- models.jar 、
。4)スタンフォード-中国corenlp-2018-10-05-ダウンロード models.jarは
、変更をアンパックスタンフォードCoreNLPフォルダを配置名前のフォルダstanfordnlpスタンフォードCoreNLP(オプション) - プリインストールjdk1.8、及び構成Javaパス。Javaパスは、入力コマンドは、Java -version通常の時刻表示、Javaでcmdをすることを確実にするために、システムのPATHとJAVA_HOME変数に追加します。
注:あなたはjdk1.8と設定環境変数、実行stanfordNLP時間が与えられていない場合は
Pythonで6)参照モデル:
stanfordcorenlp StanfordCoreNLPから•インポート
•NLP = StanfordCoreNLP(r'path 'LANG =' ZH「)
例えば:
NLP = StanfordCoreNLP(R '/ホーム /クオ/ NLP /モジュール/ stanfordnlp /'、LANG = 'ZH')
3. StanfordCoreNLP
- いくつかの単語(word_tokenize)、POSタグ付け(pos_tag)、固有表現認識(NER)、構文依存関係の分析(dependency_parse)、パース(パース)の文
#-*-encoding=utf8-*-
from stanfordcorenlp import StanfordCoreNLP
import logging
nlp = StanfordCoreNLP(r'F:\ProgramFiles\module\NLP\stanfordnlp', lang='zh')
sentence="清华大学位于北京。我要考上这个大学!"
print(nlp.word_tokenize(sentence))
print(nlp.pos_tag(sentence))
print(nlp.ner(sentence))
print(len(nlp.ner(sentence)))
print(nlp.parse(sentence))
print(nlp.dependency_parse(sentence))
音声タギング(pos_tag)、固有表現認識(NER)へ2)テキスト
from stanfordcorenlp import StanfordCoreNLP
nlp=StanfordCoreNLP(r'E:\stanford_nlp',lang='zh')
fin=open('news.txt','r',encoding='utf8')
fner=open('ner.txt','w',encoding='utf8')
ftag=open('pos_tag.txt','w',encoding='utf8')
for line in fin:
line=line.strip()
if len(line)<1:
continue
fner.write(" ".join([each[0]+"/"+each[1] for each in nlp.ner(line) if len(each)==2 ])+"\n")
ftag.write(" ".join([each[0]+"/"+each[1] for each in nlp.pos_tag(line) if len(each)==2 ]) +"\n")
fner.close()
ftag.close()
リファレンス
https://blog.csdn.net/lizzy05/article/details/87483539
https://blog.csdn.net/wanzi_antang/article/details/103938708