jiebaの導入とアプリケーションでのPythonライブラリ

平時におけるサードパーティのライブラリとしてjiebaのPythonライブラリは、例えば、いくつかのウェブサイトは、ライブラリjieba中国語の単語検索キーワード作業の使用で、非常に便利です。

まず、設置環境

ウィンドウ+のpython

第二に、インストール

声明の中で、コンピュータのオペレータコマンド(CMD)に直接書き込ま以下:にjiebaをインストールするPIP

jiebaライブラリの単語の第三に、基本的な原則

1、中国語辞書の使用は、中国語の文字の確率との間の関連を分析します

2と同様に、確率が付随する漢字フレーズの分析

図3は、また、ユーザ定義のフレーズに従って分析することができます

四、jiebaライブラリと三つの機能に対応する3つのモード

ファインモード:テキスト正確なカット、無冗長ワードを分離する(切断が正確な組成を分離した後に残されていません) 

フルモード:テキスト内のすべての可能な単語がスキャンされ、冗長

すなわち:テキストがあるかもしれない、別の単語に、異なる角度からスライスすることができます。別の言葉にフルモードで発掘されています

検索エンジンモード:長期的な再分割に基づいて正確なモード

機能 対応するモード
lcut(S) 精度モード、余分な
lcut(S、cut_all =トゥーレ) フルモード、エクストラロングフレーズ
lcut_for_search(S) 検索エンジンモデル、特別に長いフレーズ

例えば:

これらは、いくつかの基本的な知識jiebaライブラリです。

 

おすすめ

転載: www.cnblogs.com/liyanyinng/p/10958791.html