jieba 소개 및 응용 프로그램에서 파이썬 라이브러리

평화시에있는 제 3 자 라이브러리로 jieba 파이썬 라이브러리는, 예를 들어, 일부 웹 사이트는 라이브러리 jieba 중국어 단어 검색 키워드 작업의 사용은 매우 유용합니다.

첫째, 설치 환경

창 + 파이썬

둘째, 설치

는 성명에서 컴퓨터 운영자 명령 (cmd를) 직접 쓴 다음에 jieba를 설치 PIP

jieba 라이브러리의 말씀 셋째, 기본 원칙

(1) 중국어 어휘를 사용하는 한자의 확률 사이의 관계를 분석

이뿐만 아니라 한자의 분석으로 관련 악구 확률

도 3은 또한 사용자 정의 된 구문에 따라 분석 될 수있다

네, jieba 라이브러리와 세 가지 기능에 해당하는 세 가지 모드

파인 모드 : 분리 텍스트 정확한 컷, 아니 용장 워드 (절단이 정확한 성분을 분리 한 후 남아 있지) 

전체 모드 : 텍스트의 가능한 모든 단어를 중복 검사

즉 : 텍스트가있을 수 있습니다, 다른 단어로, 다른 각도에서 슬라이스 할 수있다. 다른 단어 전체 모드에서 발굴된다

검색 엔진 모드 : 장기 재분할에 기초하여 정확한 모드

기능 해당 모드
lcut (들) 정밀 모드, 별도의
lcut (S, cut_all = 진짜야) 전체 모드, 여분의 긴 문구
lcut_for_search (들) 검색 엔진 모델, 여분의 긴 문구

예를 들면 :

다음은 몇 가지 기본적인 지식 jieba 라이브러리입니다.

 

추천

출처www.cnblogs.com/liyanyinng/p/10958791.html