自然语言处理 | (16) 文本表示概述 - 代码天地

自然语言处理 | (16) 文本表示概述

其他 2019-02-22 01:01:01 阅读次数: 0

目录

1.为什么要进行文本表示

2.文本表示分类(基于粒度，从细到粗)

3.文本表示方法分类

文本表示，简单来说就是把文本变成数学上方便处理的向量(数字)而不是字符串。而怎么把字符串变成向量，是文本表示的核心问题。

1.为什么要进行文本表示

根本原因是计算机不方便直接对文本字符串进行处理，因此需要进行数值化或向量化。
便于机器学习算法处理。不仅传统的机器学习算法需要这个过程，深度学习也需要这个过程。
良好的文本表示形式可以极大的提高算法的效果。

2.文本表示分类(基于粒度，从细到粗)

词表示(将词转换为向量，更细粒度：英文中的字母/字符表示，中文中的字表示)
句子表示(或短文本表示)
文本表示(篇章表示)

3.文本表示方法分类

离散表示

1. one-hot表示

2. multi-hot表示

分布式表示

(一) 基于矩阵

1.基于降维的方法

2.基于聚类的方法

(二) 基于神经网络

1.CBOW

2.Skip-gram

3.NNLM

4.C&W

在接下里的几篇博客会详细介绍上述文本表示方法。

猜你喜欢

转载自blog.csdn.net/sdu_hao/article/details/87644166

自然语言处理 | (16) 文本表示概述

自然语言处理——文本的表示

自然语言处理概述

自然语言处理 | (19) Python中文文本表示

自然语言处理 | (17)文本的离散表示

自然语言处理——TF-IDF文本表示

自然语言处理从入门到应用——文本的表示方法

自然语言处理---文本预处理

自然语言处理——词的表示

自然语言处理——文本分类概述

自然语言处理(NLP)概述

自然语言处理(一)NLP概述

自然语言处理--概述篇

自然语言处理 —— 01概述

自然语言处理（NLP）——概述

自然语言处理-文本分类

自然语言处理—文本情感分析

自然语言处理——文本分类

文本识别（自然语言处理，NLP）

轻松入门自然语言处理系列 01 自然语言处理概述

自然语言处理：文本预处理、语言模型、RNN

自然语言处理实战----文本处理

自然语言处理之文本处理步骤

文本数据处理(自然语言处理基础)

自然语言语言处理（二）：文本的向量化

自然语言处理文本预处理（下）（张量表示、文本数据分析、文本特征处理等）

基于特征的文法分析以及概述自然语言处理

自然语言处理入门---学习方法概述

自然语言处理概述(前沿、数据集、下游任务)

自然语言处理系列（一）入门概述

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)