Python での自然言語処理を簡素化するオープンソース ライブラリ

589abef7c110ef44375106d6299fbb0a.png

迷子になった本の少年

読んだ後に必要

3

速読にはわずか1分しかかかりません

1

   

導入

TextBlob は、テキスト データを処理する自然言語処理 (NLP) タスク用の Python ライブラリです。シンプルで使いやすい API を提供し、テキスト分析、感情分析、品詞のタグ付け、名詞句の抽出などのタスクを容易にします。

TextBlob のコア機能は、NLTK (Natural Language Toolkit) とパターン ライブラリに基づいて構築されています。機械学習アルゴリズムと言語モデルを使用して、さまざまなテキスト処理タスクを実行します。

2

   

インストール

使用する前に、コマンドラインターミナルを開き、次のように入力する必要があります。

pip install textblob

インストールが成功したら、TextBlob の一般的な使用法とサンプル コードをいくつか見てみましょう。

3

   

テキスト分析

TextBlob は、テキスト内のキーワードの抽出、文の分割、単語の頻度統計など、テキストの分析に役立ちます。以下はサンプル コードです。

from textblob import TextBlob


text = "TextBlob is a great library for natural language processing."
blob = TextBlob(text)


# 提取关键词
keywords = blob.noun_phrases
print(keywords)


# 句子分割
sentences = blob.sentences
for sentence in sentences:
    print(sentence)


# 词频统计
word_counts = blob.word_counts
print(word_counts)

4

   

感情分析

TextBlob は、テキストの感情的傾向を分析するのに役立ちます。つまり、テキストが肯定的、否定的、中立的であるかどうかを判断します。以下の例を見てください。

from textblob import TextBlob


text = "I love this library!"
blob = TextBlob(text)


# 情感分析
sentiment = blob.sentiment
print(sentiment)

出力は、極性と主観性の 2 つの値を含むタプルになります。センチメント極性の値は -1 から 1 の間です。1 に近いほどポジティブなセンチメント、-1 に近いほどネガティブなセンチメント、0 に近いほどニュートラルなセンチメントです。

5

   

品詞タグ付け

TextBlob は、テキスト内の単語に対して品詞タグ付けを実行でき、つまり、各単語の品詞 (名詞、動詞、形容詞など) を決定します。

from textblob import TextBlob


text = "TextBlob is a great library for natural language processing."
blob = TextBlob(text)


# 词性标注
tags = blob.tags
for word, tag in tags:
    print(word, tag)

出力は、単語と対応する品詞を含むタプルのリストになります。

6

   

要約する

TextBlob は、名詞句の抽出、スペル チェック、言語翻訳などの他の機能も提供します。ここでは例を示し続けません。詳細については、公式ドキュメントを確認してください。アドレス: https://github.com/sloria /TextBlob (https://github.com/sloria/TextBlob)

要約すると、TextBlob は、テキスト データを使用した自然言語処理タスク用の強力で使いやすい Python ライブラリです。TextBlob を使用すると、複雑な NLP アルゴリズムやモデルを深く理解していなくても、テキスト分析、感情分析、品詞のタグ付けなどのタスクを簡単に実行できます。

7

   

無料コミュニティ

32136ef1fb6870c5dae0e60206548812.jpeg

f102c7764f8cab30a045f8644dadd97b.gif

おすすめ

転載: blog.csdn.net/djstavaV/article/details/133473729