自然语言处理-文本分类

其他 2018-07-13 05:11:39 阅读次数: 0

一、模型的选择

①特征数量很多，和样本数量差不多，选择逻辑回归（LR）或线性支持向量机（SVM）。

②特征数量比较小，样本数量一般，不大也不小，选择SVM的高斯核函数版本。

③数据量非常大，又非线性，使用决策树（DT）的升级版本-随机森林。

④数据量巨大，特征向量也非常大，用神经网络深度学习模型。

二、大致步骤

1）定义阶段：定义数据以及分类体系，具体分为哪些类别，需要哪些数据。

2）数据预处理：对文档做分词、去停用词等准备工作。

3）数据提取特征：对文档矩阵进行降维，提取训练集中最有用的特征。

4）模型训练阶段：选择具体的分类模型以及算法，训练出文本分类器。

5）评测阶段：在测试集上测试并评价分类器性能。

扫描二维码关注公众号，回复： 2150769 查看本文章

6）应用阶段：应用性能最高的分类模型对文本进行分类。

更详细的文本分类模型描述

文本分类解决方法综述

https://www.cnblogs.com/sxron/p/7742692.html

猜你喜欢

转载自blog.csdn.net/qq_32899201/article/details/80927503

自然语言处理-文本分类

自然语言处理——文本分类

DC自然语言处理———文本分类基础

五、自然语言处理中的文本分类

自然语言处理——文本分类概述

自然语言处理-文本分类入门

Python自然语言处理笔记【一】文本分类之监督式分类

Python自然语言处理笔记【二】文本分类之监督式分类的细节问题

《自然语言处理》第二次作业：语言模型和文本分类

使用lingpipe自然语言处理包进行文本分类

文本分类方向的一点探索 | 解读自然语言处理技术现状

Python自然语言处理-学习笔记(6) ——— 文本分类

自然语言处理——文本分类平台功能及UI设计

Python自然语言处理—文本分类—朴素贝叶斯

自然语言处理 | (23) 基于RCNN的文本分类原理

自然语言处理 | (22) 基于TextRNN的文本分类原理

自然语言处理 | (21) 基于TextCNN的文本分类原理

自然语言处理（二）基于CNN的新闻文本分类

自然语言处理 | (29) 基于Hierarchical Attention Network的文本分类原理

自然语言处理朴素贝叶斯新闻文本分类

【自然语言处理】文本分类模型_TextCNN_TensorFlow实现

【自然语言处理】基于双向LSTM(Bi-LSTM)文本分类的Tensorflow实现

自然语言处理（NLP）：08 基于Pytorch深度学习-短文本分类

【自然语言处理NLP】中文语料整理【情感分析、文本分类、摘要、实体分析】

自然语言处理（NLP）：07 fastText训练中文模型-文本分类

自然语言处理（NLP）：06 word2vec训练中文模型-文本分类

自然语言处理动手学Bert文本分类

Linux系统：自然语言处理（NLP）环境搭建【智能文本分类系统安装部署】

自然语言处理实战：新闻文本分类（附代码）

中文自然语言处理--TextCNN文本分类（keras实现）

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)