Sklearn之日常所见

其他 2018-05-16 11:31:50 阅读次数: 2

sklearn.datasets.fetch_20newsgroups

官方链接：sklearn.datasets.fetch_20newsgroups

sklearn.datasets.fetch_20newsgroups(data_home=None, subset=’train’, categories=None, shuffle=True, random_state=42, remove=(), download_if_missing=True)

加载20个新闻组数据集的文件名和数据。

参数	说明
data_home	可选属性，默认为 None ，指定数据集的下载和缓存文件夹。如果为 None ，则所有 scikit-learn 数据都存储在 ‘〜/ scikit_learn_data’ 子文件夹中。
subset	可选属性，可以为 train’ 或 test, all ，选择要加载的数据集：train 为训练集，test 为测试集，all 为训练集和测试集
categories	None 或字符串集合或 unicode ，默认为 None ，表示加载所有类别。如果不为空，则加载指定的类别。
shuffle	可选属性， bool 类型。选择是否对数据集进行 shuffle 操作。
random_state	numpy 随机数生成器或整数种子。用于对数据集进行 shuffle 操作。
remove	可能包含（ ‘headers’, ‘footers’, ‘quotes’）的任何子集。其中每种都是将从新闻组帖子中检测到并删除的文本类型，从而防止分类符过度拟合元数据。
download_if_missing	可选属性，默认为 True 。如果为 False ，若数据不是本地可用的，而是尝试从源站点下载数据，则引发 IOError 。

猜你喜欢

转载自blog.csdn.net/wangyang163wy/article/details/79896661

Sklearn之日常所见

vim之日常使用

Mac之日常操作

Pytorch之日常整理

kubernetes之日常管理

所见所闻

FPGA学习之日常工作

杂谈：所见非所得

程序媛必备之日常BGM

php之日常小技巧一 &&符号

Oracle维护之日常伪DBA操作

【随便之日常积累】第1则

安全管理之日常日志审计

FPGA学习之日常工作复位电路

算法题之日常刷题 0001

算法题之日常刷题 0003

算法题之日常刷题 0002

CANopen个人之所见，所想

所见即所得 dialog

所见不凡，自然所建不凡

转载秋招群里的所见

fastText之我所见（一）

所见即所得

投资组合优化之我所见

软件工程——我所见

es6 promise 所见

自己近几天的所见，所想

python之日常，操作文件和目录

Linux技术学习之日常中常用命令

桌面云之日常维护功能及功能特性

今日推荐

“开源信徒”周鸿祎开源360智脑大模型

华为ensp中vrrp虚拟路由器冗余协议原理及配置命令

基于Python爬虫广东广州水酒店宾馆数据可视化系统设计与实现(Django框架) 研究背景与意义、国内外研究现状

知识融合：知识图谱构建的关键技术

文心一言收费还是免费：全面解析其价格策略与服务价值

百万用户通话新风潮：仅需50秒，无界AI让彩铃变身短视频

【STM32项目】基于STM32多传感器融合的新型智能导盲杖设计（完整工程资料源码）

文生视频大模型Sora的复现经验

腾讯云函数计算技术：云原生架构下的Serverless与微服务新篇章

干货分享｜JumpServer 三种常见的文件传输方式效果对比

【榜单公布】2023年度征文活动已结束

周排行

Java中关于时间的操作及格式化

《HTML5与CSS3基础教程》第五章学习笔记图像

nginx下安装PHP发生问题的逐步解决

HDU-1048，The Hardest Problem Ever（字符串处理）

新一代多媒体技术与应用的部分课后题

Shader 绘制特殊图形

Oracle数据库三种备份方案

CodeForces - 983B XOR-pyramid(两次区间DP/记忆化DFS)

Python3基础语法——变量与运算符

（转载）KMP算法详解（原创）详解KMP算法

每日归档

更多

2024-04-16(70)

2024-04-15(42)

2024-04-14(0)

2024-04-13(119)

2024-04-12(38)

2024-04-11(14)

2024-04-10(68)

2024-04-09(5)

2024-04-08(60)

2024-04-07(4)