python中的模块（包） - 代码天地

python中的模块（包）

其他 2020-04-01 18:29:18 阅读次数: 0

jieba

1.安装及入门介绍

推荐

pip install jieba

结巴中文分词涉及到的算法包括：

(1) 基于Trie树结构实现高效的词图扫描，生成句子中汉字所有可能成词情况所构成的有向无环图（DAG)；
(2) 采用了动态规划查找最大概率路径, 找出基于词频的最大切分组合；
(3) 对于未登录词，采用了基于汉字成词能力的HMM模型，使用了Viterbi算法。

结巴中文分词支持的三种分词模式包括：

(1) 精确模式：试图将句子最精确地切开，适合文本分析；
(2) 全模式：把句子中所有的可以成词的词语都扫描出来, 速度非常快，但是不能解决歧义问题；
(3) 搜索引擎模式：在精确模式的基础上，对长词再次切分，提高召回率，适合用于搜索引擎分词。
同时结巴分词支持繁体分词和自定义字典方法。

#encoding=utf-8
import jieba

#全模式
text ="我来到北京清华大学"
seg_list = jieba.cut(text, cut_all=True)
printu"[全模式]: ","/ ".join(seg_list)

#精确模式
seg_list = jieba.cut(text, cut_all=False)
printu"[精确模式]: ","/ ".join(seg_list)
#默认是精确模式
seg_list = jieba.cut(text)
printu"[默认模式]: ","/ ".join(seg_list)
#新词识别 “杭研”并没有在词典中,但是也被Viterbi算法识别出来了
seg_list = jieba.cut("他来到了网易杭研大厦")
printu"[新词识别]: ","/ ".join(seg_list)

#搜索引擎模式
seg_list = jieba.cut_for_search(text)
printu"[搜索引擎模式]: ","/ ".join(seg_list)

代码中函数

猜你喜欢

转载自blog.csdn.net/weixin_43093289/article/details/90633673

Python中的模块包

python中的模块（包）

Python中的模块与包

Python中的包与模块

Python中的模块与包的总结

python中的包和模块

python中的模块和包

Python中模块及包的使用

Python中的模块与包2

Python中的模块与包1

python中模块和包

python中的包、模块及导入

Python中模块与包的概念

python 中模块，包，与常用模块

Python中Module（模块）和Package（包）

Python 中包/模块的 `import` 操作

python中模块和包的概念

python中模块和包的定义/解释

Python中的模块与包#学习猿地

粗浅理解Python中包与模块的区别

python中包的介绍与常用模块

Python中包和模块，=，is的使用

Python——导入包模块中遇到的问题

08-python中的包与模块

Python 中引入多个模块，包的概念

python中包，模块，类的相关知识

python中的模块和包是什么？

Python中模块和包基础学习

模块与包 python之路——模块和包

python的模块与包

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)