文本分类（课堂笔记）

其他 2018-08-14 10:08:44 阅读次数: 0

这次的文章是根据牛津大学的公开课深度学习NLP中关于文本分类的课堂笔记（其实就是一些截图了，因为后来发现这个课程比较基础）。
原视频看这里：https://www.bilibili.com/video/av9817911/?p=7

首先，文本分类都有什么类型呢？
二值分类；
单标签分类；
多标签分类；
聚类（无标签）

那么分类都有哪些方法呢？各有什么优缺点？
这个比较简单，直接截图吧。
这里写图片描述

我们常用的便是基于statistical的文本分类方法。可以把这个问题表示为P(c|d), d 代表文本的表征，c代表文本的类别。
现在我们就可以把文本分类拆分成两个步骤：
表征文本；
求出文本属于类别c的概率

那表示文本的方法有哪些呢？
这里写图片描述

求概率的模型又有哪些呢？
这里写图片描述

下面列举几个常见的模型以及其优缺点：
朴素贝叶斯：
这里写图片描述

逻辑回归：
这里写图片描述

CNN:
这里写图片描述

猜你喜欢

转载自blog.csdn.net/weixin_42936560/article/details/81610410

文本分类（课堂笔记）

笔记-文本分类

文本分类笔记

【NLP_Stanford课堂】文本分类

【NLP_Stanford课堂】文本分类2

TextRCNN 文本分类阅读笔记

文本分类 LDA算法学习笔记

新闻文本分类学习笔记

文本分类

文本分类步骤

文本分类入门

Rocchio文本分类

5.1、文本分类

大话文本分类

文本分类-TextCNN

CNN文本分类

flair文本分类

fasttext文本分类

文本分类模型

xgboost文本分类

文本分类：survey

自制文本分类

文本分类总结

文本分类实战

高效的文本分类

TextCNN(文本分类)

SVM文本分类

文本分类问题

文本分类概述

TextCNN文本分类

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)