自然语言处理步骤与关键实际应用场景 - 代码天地

自然语言处理步骤与关键实际应用场景

其他 2018-08-04 05:16:38 阅读次数: 0

一、自然语言处理步骤

1.收集数据：文本信息的常见来源包括-商品评价、用户产出的内容(推文、帖子、提问等)、问题解决方案等

2.清洗数据：去除一切不相关的字符-比如任何非数字字母的字符(针对英文)；标记文本，并拆分为独立的单词；去除不相关的词语；所有字母转换为小写；将拼错的单词或者多种拼法的单词与某个特定的表达绑定；考虑词形还原

3.找到好的数据表达方式(one-hot representation)：例如可以为数据集中的所有单词制作一张词表，将每个单词和一个唯一的索引关联。每个句子都是由一串数字组成(词表中独立单词对应的个数)。通过列表的索引，可以统计出句子中某个单词出现的次数(即词袋模型)，完全忽略句子中单词的顺序

4.分类

5.检验

6.解释词语结构：在词袋模型的基础上进行TF-IDF评分

7.利用语义：模型部署之后很有可能遇到在训练集中没有出现过的单词，那么模型可能就无法准确的为这些推文分类。需要获取到词语的语义来解决这个问题(比如：Word2Vec词向量-用来为单词寻找连续嵌入的技术)，也就是说我们需要理解“good”和“positive”比“apricot”和“continent”更接近。Word2Vec通过读取大量文本并记忆出现在相似上下文中的单词进行学习，在经过足够的训练后，它会为词表中的每个单词生成生成一个100-300维的向量，具有相似含义的单词会靠的更近

二、NLP关键的实际应用

1.识别不同使用者/用户的客户群(预测用户流失、生命周期价值、产品偏好)

2.精准检测和提取反馈分类(正负面的评论观点、对衣服尺寸或舒适度等一些特别属性的提及)

3.根据意图进行文本分类(请求普通帮助、紧急问题处理)

4.对微博信息进行分析，通过社交舆情看关注点

5.对邮件分析，结合贝叶斯算法判断哪些是垃圾邮件

猜你喜欢

转载自blog.csdn.net/qq_38984677/article/details/81174476

自然语言处理步骤与关键实际应用场景

自然语言处理的应用场景

自然语言处理在营销中的应用场景

腾讯云自然语言处理接口服务的经典应用场景（二）

腾讯云自然语言处理接口服务的经典应用场景（三）

腾讯云自然语言处理 NLP：产品优势 & 应用场景

腾讯云自然语言处理接口服务的经典应用场景（一）

人工智能-自然语言处理(NLP)-应用场景：搜索引擎

基于文本分类和情感分析的自然语言处理技术及应用场景

【ChatGPT4】 NLP（自然语言处理）第八课情感分析的概念和应用场景

【HanLP】--自然语言处理场景应用

自然语言处理典型场景分析

AI在自然语言处理的主要步骤

[NLP]自然语言的处理步骤

人工智能-自然语言处理(NLP)-应用场景-Seq2Seq：看图说话【将一张图片转为一段文本】

自然语言处理：长文本场景下的关键词抽取实践

自然语言处理中的应用综述

HMM在自然语言处理中的应用

自然语言处理-NLP应用分类

自然语言处理--应用篇

cnn在自然语言处理的应用

自然语言处理23-NLP中关键步骤：句子嵌入的原理与应用，并通过多种形式实现

自然语言处理之文本处理步骤

自然语言处理从入门到应用——自然语言处理的应用任务

自然语言处理

自然语言处理①

自然语言处理从入门到应用——自然语言处理的语言模型（Language Model，LM）

自然语言处理-实际开发:用语义开放平台olami写一个翻译的应用

什么是自然语言处理，自然语言处理目前的应用有哪些？

人工智能-自然语言处理(NLP)-应用场景-聊天机器人(二)：Seq2Seq【CHAT/闲聊机器人】--＞ BeamSearch算法预测【替代贪心算法预测】

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)