python-jieba ライブラリとは何か、およびその使用方法 - コードワールド

python-jieba ライブラリとは何か、およびその使用方法

プログラミング 2023-05-17 08:11:30 訪問数: null

1: 概要

Jieba は、中国語の単語セグメンテーションのための優れたサードパーティライブラリです。

中国語テキストは単語分割を通じて個々の単語を取得する必要がある

Jieba は中国語単語分割用の優れたサードパーティライブラリですが、追加のインストールが必要です

jieba ライブラリには 3 つの単語分割モードが用意されており、最も単純なモードでは関数をインストールするだけで済みます。

jieba ライブラリは、中国語シソーラスを使用して単語の分割を識別します。

インストールコマンドは以下のとおりです。

→→→→→→→→→「windows+r」をクリックしてコマンドプロンプトに入り、「cmd」と入力し、インターフェースに入ったら「 pip install jieba 」と入力します。インストールできます。

2: jieba ライブラリの使用手順

(1) jieba 単語分割の 4 つのモード

完全一致モード、完全モード、検索エンジンモード、新分詞

① jieba.cut(s) 精密モード: 冗長な単語を含まずにテキストを正確に分割します。

② jieba.lcut(s,cut_all=True) フルモード: テキスト内のすべての可能な単語をスキャンします。冗長性があります。

③jieba.lcut_for_search(s) 検索エンジンモード: 正確なモードに基づいて、長い単語を再度分割します:

④jieba.add_word(w)、新しい単語 w を単語分割辞書に追加します。

コード例は次のとおりです。

import jieba
a=jieba.add_word("奇才队控球后卫约翰沃尔是NBA超级巨星")
b=jieba.lcut("奇才队控球后卫约翰沃尔是NBA超级巨星")print(b)

実行中のインターフェイスは次のとおりです。

キーポイント: jieba.lcuts(s) は、文字列 s に対して正確な単語の分割を実行し、リスト型を返すことができます。

———————————————

参考記事リンク：

https://cloud.tencent.com/developer/article/2154756

https://blog.csdn.net/weixin_61631131/article/details/124274495

おすすめ

転載: blog.csdn.net/weixin_43934631/article/details/129163373

python-jieba ライブラリとは何か、およびその使用方法

Python ツールライブラリとは何ですか?また、Python ツールパッケージの使用方法は何ですか?

Pythonのjiebaライブラリの使用と単語雲の使用

Py's AV: Python でのオーディオおよびビデオ処理の優れたコンパニオン、AV ライブラリの包括的な紹介、詳細なインストールと使用方法。

Pythonのjiebaライブラリ命令

Shapely ライブラリの使用、幾何学的関係の効率的な処理、および点、線、面の関連拡張 (GeoPandas ライブラリ) Python

Pythonプログラミング学習：関数をより柔軟にする* argsと** kwargs（パラメーターの数が異なる設計関数）の概要、それらの使用方法、および古典的なケースの詳細なガイド

Spring Boot の MyBatis とは何か、およびその使用方法

Spring Boot の HQL とは何か、およびその使用方法

Python3telnetlibライブラリの使用方法

python-EEGツールライブラリMNE中国のコース（1）-MNE生データ構造とその使用方法の紹介

python jiebaライブラリ命令

Pillow: Python 画像処理ライブラリ (インストールと使用方法のチュートリアル)

Python の組み込みライブラリの hasattr 関数の使用方法

Spring Boot の RabbitTemplate とは何か、その原理、および使用方法

Spring Boot の SimpMessagingTemplate とは何か、その原理、および使用方法

Spring Boot のセッションとは何か、およびその使用方法

コンピュータビジョンライブラリと基本的な使用方法でのpython

Python PyPDF2 ライブラリを使用して PDF テキスト (およびその他の高度な操作) を簡単に抽出

Python プログラミングにおける fft のメリットとデメリット、および cuda プログラミング、cuda 並列演算、信号処理の使用方法 (推奨)

Day10 --- Pythonのライブラリjieba

Pythonの作業：jiebaライブラリー

<Pythonのオーディオライブラリ：Windowsではpydubインストール構成、および共通APIから生じる問題>

Pythonランダムライブラリの使用方法を学ぶための1分

SpringBoot の使用方法 — jasypt 暗号化および復号化ライブラリ

Spring Boot の @Transactional アノテーションとは何ですか、その原理、および使用方法

Spring Boot の @PutMapping アノテーションとは何ですか、その原理、および使用方法

Python の numpy ライブラリと matplotlib ライブラリを組み合わせて、レーダーチャート、ヒストグラム、サインおよびコサインカーブ、および 3 次元画像を実現します。

Python の一般的な開発フレームワークとライブラリは何ですか?

Python がダイナミックリンクライブラリ .dll および .so を呼び出す方法の詳細な記録

おすすめ

NetBSD は AI によって生成されたコードの提出を禁止します

ランキング

C＃の変数インスタンス、クレジット・カードケース

通过uniCloud白捡一个在线图库管理工具

Linuxのいくつかの基本的なコマンドに関する洞察（20ベース）

vueエントリーの基礎知識、コア知識をマスターするならこの記事で十分

食品化学クエスチョンバンク

CentOSの7制御システムは、ファイルを占めます

単一の el-form 内の el-form-item テキストの左揃えを解決する方法

ノードJSベースノート

関数にSQL Serverの文字列：

sparksql_相関分析

アーカイブ

もっと

2024-05-18(30)

2024-05-17(6)

2024-05-16(24)

2024-05-15(5)

2024-05-14(9)

2024-05-13(8)

2024-05-12(27)

2024-05-11(31)

2024-05-10(33)

2024-05-09(30)