TextBlob实战之朴素贝叶斯文本分类

其他 2019-01-31 16:00:51 阅读次数: 0

版权声明：转载请注明出处，谢谢~~ https://blog.csdn.net/m0_37306360/article/details/85873907

更多实时更新的个人学习笔记分享，请关注：
知乎：https://www.zhihu.com/people/yuquanle/columns
微信订阅号：AI小白入门
ID: StudyForAI

TextBlob实现文本分类

一个使用TextBlob进行Naive Bayes classifier
参考：https://textblob.readthedocs.io/en/dev/classifiers.html#classifiers

1.准备数据集：训练集和测试集

train = [
...     ('I love this sandwich.', 'pos'),
...     ('this is an amazing place!', 'pos'),
...     ('I feel very good about these beers.', 'pos'),
...     ('this is my best work.', 'pos'),
...     ("what an awesome view", 'pos'),
...     ('I do not like this restaurant', 'neg'),
...     ('I am tired of this stuff.', 'neg'),
...     ("I can't deal with this", 'neg'),
...     ('he is my sworn enemy!', 'neg'),
...     ('my boss is horrible.', 'neg')
... ]

test = [
...     ('the beer was good.', 'pos'),
...     ('I do not enjoy my job', 'neg'),
...     ("I ain't feeling dandy today.", 'neg'),
...     ("I feel amazing!", 'pos'),
...     ('Gary is a friend of mine.', 'pos'),
...     ("I can't believe I'm doing this.", 'neg')
... ]

2.创建朴素贝叶斯分类器

from textblob.classifiers import NaiveBayesClassifier

3.把训练丢进去训练

nb_model = NaiveBayesClassifier(train)

4.预测新来的样本

dev_sen = "This is an amazing library!"
print(nb_model.classify(dev_sen))

pos

也可以计算属于某一类的概率

dev_sen_prob = nb_model.prob_classify(dev_sen)
print(dev_sen_prob.prob("pos"))

0.980117820324005

5.计算模型在测试集上的精确度

print(nb_model.accuracy(test))

0.8333333333333334

猜你喜欢

转载自blog.csdn.net/m0_37306360/article/details/85873907

TextBlob实战之朴素贝叶斯文本分类

朴素贝叶斯文本分类（详解）

Mahout朴素贝叶斯文本分类

【机器学习】朴素贝叶斯文本分类案例

NLP1(朴素贝叶斯文本分类)

贝叶斯文本分类

实战朴素贝叶斯文本分类：从导入数据文件到得到84%准确率

机器学习-朴素贝叶斯文本分类Python实现

贝叶斯文本分类 java实现

机器学习(三) 贝叶斯文本分类问题

文本分类之朴素贝叶斯算法

机器学习实战：朴素贝叶斯模型之文本分类

文本分类--朴素贝叶斯

机器学习基础——带你实战朴素贝叶斯模型文本分类

朴素贝叶斯算法文本分类原理

朴素贝叶斯在文本分类中的应用

基于朴素贝叶斯的文本分类(二)

文本分类---朴素贝叶斯(2)

朴素贝叶斯实现的文本分类

sklearn+python:朴素贝叶斯及文本分类

(三)朴素贝叶斯运用——文本分类

朴素贝叶斯进行文本分类

机器学习-文本分类实例-朴素贝叶斯

朴素贝叶斯原理及文本分类

文本分类（朴素贝叶斯算法）

芝麻HTTP：记scikit-learn贝叶斯文本分类的坑

【甘道夫】通过Mahout构建贝叶斯文本分类器案例详解

基于Java和map/reduce实现的贝叶斯文本分类器设计

朴素贝叶斯&基于朴素贝叶斯的文本分类算法

机器学习之朴素贝叶斯模型（文本分类，垃圾邮件识别）

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)