平時におけるサードパーティのライブラリとしてjiebaのPythonライブラリは、例えば、いくつかのウェブサイトは、ライブラリjieba中国語の単語検索キーワード作業の使用で、非常に便利です。
まず、設置環境
ウィンドウ+のpython
第二に、インストール
声明の中で、コンピュータのオペレータコマンド(CMD)に直接書き込ま以下:にjiebaをインストールするPIP
jiebaライブラリの単語の第三に、基本的な原則
1、中国語辞書の使用は、中国語の文字の確率との間の関連を分析します
2と同様に、確率が付随する漢字フレーズの分析
図3は、また、ユーザ定義のフレーズに従って分析することができます
四、jiebaライブラリと三つの機能に対応する3つのモード
ファインモード:テキスト正確なカット、無冗長ワードを分離する(切断が正確な組成を分離した後に残されていません)
フルモード:テキスト内のすべての可能な単語がスキャンされ、冗長
すなわち:テキストがあるかもしれない、別の単語に、異なる角度からスライスすることができます。別の言葉にフルモードで発掘されています
検索エンジンモード:長期的な再分割に基づいて正確なモード
機能 | 対応するモード |
lcut(S) | 精度モード、余分な |
lcut(S、cut_all =トゥーレ) | フルモード、エクストラロングフレーズ |
lcut_for_search(S) | 検索エンジンモデル、特別に長いフレーズ |
例えば:
これらは、いくつかの基本的な知識jiebaライブラリです。