伪知识之通俗易懂的解释自然语言处理中的专业名词零持续更新【内向即衰亡--沈吟秋】 - 代码天地

伪知识之通俗易懂的解释自然语言处理中的专业名词零持续更新【内向即衰亡--沈吟秋】

编程语言 2018-09-24 05:26:58 阅读次数: 0

内容并不完全靠谱，仅供参考

自然语言处理的基本内容如下：

①：中文实体识别，关系抽取，依存句法

词性标注>中文分词>情感分析>信息抽取>实体识别>关系依存

大致内容：上海自来水来自海上--------

分词规则：上海|自来水|来自|海上

大致内容：对每个词进行词性标注，比如副词，动词，名词

大致内容：从文本中识别出基本特征的文本内容，比如人名，地名

一．自然语言处理之基本模块介绍：

import jieba test_text=jieba.cut('我来到上海自来水厂检查水源',cut_all=False)

print('/'.join(list(test_text)))

不是全模式就是精确模式

Res：

而默认情况下就是精确模式

我/来到/上海/自来水厂/检查/水源

二．Analyse import jieba.analyse content=""" 首先罗的定位是罪恶一代的靠前几位的超新星，又是"d"之一族，资质奇高。在说罗的战绩，一刀切下藤虎的陨石，而面不改色，从藤虎重力下逃脱，在明哥眼皮底下救下山治一命一刀两断，和常态明哥单打独斗，被废掉一命后装死，配合2档路飞冲刺，用伽马刀偷袭得逞，新买休克补刀差点击杀明哥，无奈明哥果实开发逆天。。 """ content_jieba=jieba.analyse.extract_tags(content,topK=10,allowPOS=0,withWeight=True)

for x,y in enumerate(content_jieba):

print(x,y[0],y[1]) |

权重 Topk 无监督学习方法：

更具文本内容中出现的词频，来返回出现结果一次最多的次数

allowPOS 仅包括指定词性的词，默认值为空，即不筛选

当词频的结果是20时，Topk=10的作用是，当数量大于10时，比如20，返回10 当词频的结果是2时，Topk=10的作用只是限制比这个数量大，而不比这个数量小的结果

content_jieba=jieba.analyse.extract_tags(content,topK=5,allowPOS='i',withWeight=True)

for x,y in enumerate(content_jieba):

print(x,y[0],y[1])

Res：

1 一刀两断 3.468056696833333

2 一刀切 3.257847755643333

二． import jieba.posseg as po 功能实现逐一的精确分词，同时标注词性

content_jieba_=po.cut(content)

for x,y in content_jieba_:

print(x, y)

Res： [pair('\n', 'x'), pair('首先', 'd')]

猜你喜欢

转载自blog.csdn.net/qq_37995231/article/details/82819568

伪知识之通俗易懂的解释自然语言处理中的专业名词零持续更新【内向即衰亡--沈吟秋】

伪知识之通俗易懂的解释自然语言处理中的专业名词一【内向即无能--刘金懿】

伪知识之通俗易懂的解释自然语言处理中的专业名词二【内向即死刑--蔡一婷】

伪知识之通俗易懂得解释图像识别常用技巧持续更新:【内向即废物--沈吟秋】

伪知识之通俗易懂得解释强类型语言和弱类型语言的区别持续更新:【内向即废物--沈吟秋】

伪知识之通俗易懂得解释python中的内存地址的作用持续更新:【内向即低能--沈吟秋】

伪知识之通俗易懂得解释python中异常类和异常链的区别持续更新:【内向即傻子--沈吟秋】

伪知识之通俗易懂得解析selenium常用模拟登陆技巧持续更新:【内向即废物--沈吟秋】

伪知识之通俗易懂的解释pymssql的基本操作流程持续更新【内向即哑巴--高悦妮】

伪知识之通俗易懂得解释python编程常用规范持续更新:【内向即穷人--王艳】

伪知识之通俗易懂得部署scrapy的spiderkeeper持续更新: 【内向即失败--王奕君】

伪知识之通俗易懂的解释网络调试技巧【内向即厄运--金励】

伪知识之通俗易懂的解释文本去重中的TF-IDF算法原理及实现方式【内向即厕所--王奕君】

python伪代码之爬取秒贷金融p2p信息运行代码持续更新:【内向即废物--沈吟秋】

语料库之手机号持续更新:【内向即废物--沈吟秋】

伪知识之通俗易懂的解释基本函数，全局变量，局部变量，内嵌函数，闭包，作用域，装饰器的演变步骤【内向即耻辱--王奕君】

伪知识之通俗易懂得解析python仓库的体系结构持续更新:

编程类基本知识---尽量通俗易懂---持续更新中

自然语言处理系列：自然语言处理概念与名词解释（2）

专业名词解释

编程里需要知道的专业名词（持续更新）

不能更通俗易懂的机器学习名词解释

通俗易懂的解释numpy中的广播

NLP-自然语言处理入门（持续更新）

自然语言处理评测汇总（持续更新）

通俗易懂C语言---知识补充

机器学习的专业名词解释

气象专业名词解释

rpc通俗易懂的解释

基础知识以及专业名词

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)