贝叶斯公式实战 - 代码天地

贝叶斯公式实战

其他 2021-04-03 12:03:10 阅读次数: 0

from sklearn.datasets import fetch_20newsgroups
from sklearn.model_selection import train_test_split
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.naive_bayes import MultinomialNB


def nb_news():
    """
    用贝叶斯算法，对新闻进行分类
    :return:
    """
    # 1)获取数据
    news = fetch_20newsgroups(subset="all")
    # print(news)
    # 2)划分数据集
    x_train, x_test, y_train, y_test = train_test_split(news.data, news.target)

    # 3)特征工程：文本的特征抽取tfidf
    tf = TfidfVectorizer()
    x_train = tf.fit_transform(x_train)
    x_test = tf.transform(x_test)

    # 4）贝叶斯算法预估器流程
    estimator = MultinomialNB()
    estimator.fit(x_train, y_train)

    # 5）模型的评估
    # 方法一：直接比较
    y_predict = estimator.predict(x_test)
    print("预测值和真实值对比：\n", y_test == y_predict)

    # 方法二：计算准确率
    score = estimator.score(x_test, y_test)
    print("准确率为:\n", score)
    return None



# def nbcls():
#     """
#     朴素贝叶斯对新闻数据集进行预测
#     :return:
#     """
#     # 获取新闻的数据，20个类别
#     news = fetch_20newsgroups(subset='all')
#
#     # 进行数据集分割
#     x_train, x_test, y_train, y_test = train_test_split(news.data, news.target, test_size=0.3)
#
#     # 对于文本数据，进行特征抽取
#     tf = TfidfVectorizer()
#
#     x_train = tf.fit_transform(x_train)
#     # 这里打印出来的列表是：训练集当中的所有不同词的组成的一个列表
#     print(tf.get_feature_names())
#     # print(x_train.toarray())
#
#     # 不能调用fit_transform
#     x_test = tf.transform(x_test)
#
#     # estimator估计器流程
#     mlb = MultinomialNB(alpha=1.0)
#
#     mlb.fit(x_train, y_train)
#
#     # 进行预测
#     y_predict = mlb.predict(x_test)
#
#     print("预测每篇文章的类别：", y_predict[:100])
#     print("真实类别为：", y_test[:100])
#
#     print("预测准确率为：", mlb.score(x_test, y_test))
#
#     return None


if __name__ == "__main__":
    nb_news()

猜你喜欢

转载自blog.csdn.net/weixin_44010756/article/details/112222823

贝叶斯公式实战

贝叶斯公式

浅谈贝叶斯公式

图解贝叶斯公式

全概率公式与贝叶斯公式

贝叶斯公式/贝叶斯法则/贝叶斯定理

【机器学习】朴素贝叶斯-贝叶斯公式

从贝叶斯公式到贝叶斯判别准则

贝叶斯公式图解推导

贝叶斯概率公式浅解

简单理解贝叶斯公式

贝叶斯公式，对似然函数

贝叶斯相关公式（Bayes）

2.1 闲聊贝叶斯公式

[work*] 贝叶斯公式的通俗解释

搞懂朴素贝叶斯公式

贝叶斯公式的通俗理解

从条件概率到贝叶斯公式

原声版的朴素贝叶斯公式

数据挖掘：贝叶斯（Bayes）公式

贝叶斯公式，定理理解

统计机器学习-贝叶斯公式

【图解】条件概率、贝叶斯公式

贝叶斯公式经典题

贝叶斯公式实际例子

条件概率、全概率公式与贝叶斯公式

理解全概率公式与贝叶斯公式

浅谈全概率公式和贝叶斯公式

全概率公式和贝叶斯公式

大数据背后的神秘公式（上）：贝叶斯公式

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)