Python 中文分词 jieba.cut(小白进)

cut(sentence, cut_all=False, HMM=True)

1、创建【生成器】对象

import jieba
# 将要被切词的文本
sentence = '订单数据分析'
# 创建【生成器】对象
generator = jieba.cut(sentence)
print(generator)

print结果:

<generator object Tokenizer.cut at 0x000002474EF43EB8>

2、cut_all参数

精确模式:cut_all=False(默认)
全模式:cut_all=True

# 精准模式
unique = jieba.cut(sentence)
for i in unique:
    print(i)

订单
数据分析

# 全模式
repeat = jieba.cut(sentence, cut_all=True)
for i in repeat:
    print(i)

订单
订单数
单数
数据
数据分析
分析

cut_for_search(sentence,HMM=True)

# 搜索引擎模式
search = jieba.cut_for_search(sentence)
for i in search:
    print(i)

订单
数据
分析
数据分析

猜你喜欢

转载自blog.csdn.net/yellow_python/article/details/80559586
今日推荐