평화시에있는 제 3 자 라이브러리로 jieba 파이썬 라이브러리는, 예를 들어, 일부 웹 사이트는 라이브러리 jieba 중국어 단어 검색 키워드 작업의 사용은 매우 유용합니다.
첫째, 설치 환경
창 + 파이썬
둘째, 설치
는 성명에서 컴퓨터 운영자 명령 (cmd를) 직접 쓴 다음에 jieba를 설치 PIP
jieba 라이브러리의 말씀 셋째, 기본 원칙
(1) 중국어 어휘를 사용하는 한자의 확률 사이의 관계를 분석
이뿐만 아니라 한자의 분석으로 관련 악구 확률
도 3은 또한 사용자 정의 된 구문에 따라 분석 될 수있다
네, jieba 라이브러리와 세 가지 기능에 해당하는 세 가지 모드
파인 모드 : 분리 텍스트 정확한 컷, 아니 용장 워드 (절단이 정확한 성분을 분리 한 후 남아 있지)
전체 모드 : 텍스트의 가능한 모든 단어를 중복 검사
즉 : 텍스트가있을 수 있습니다, 다른 단어로, 다른 각도에서 슬라이스 할 수있다. 다른 단어 전체 모드에서 발굴된다
검색 엔진 모드 : 장기 재분할에 기초하여 정확한 모드
기능 | 해당 모드 |
lcut (들) | 정밀 모드, 별도의 |
lcut (S, cut_all = 진짜야) | 전체 모드, 여분의 긴 문구 |
lcut_for_search (들) | 검색 엔진 모델, 여분의 긴 문구 |
예를 들면 :
다음은 몇 가지 기본적인 지식 jieba 라이브러리입니다.