sklearn笔记

其他 2018-06-26 09:58:45 阅读次数: 3

1. 数据预处理

sklearn.preprocessing.scale( data )，sklearn.preprocessing.StandardScaler 对给定数据进行标准化（均值、方差）

sklearn.preprocessing.MinMaxScaler 将属性缩放到一个指定范围

sklearn.preprocessing. nomalize（），sklearn.preprocessing.Nomalizer 正则化

两个关键的函数 fit和transform，fit让数据适应模型，transform转换数据

2. 特征提取

DictVectorizer

参考：https://blog.csdn.net/qq_36847641/article/details/78279309

提取前的字典结构

这里写图片描述

提取后的数组结构

3. 测试集和训练集划分

train_test_split 函数用于将矩阵随机划分为训练子集和测试子集，并返回划分好的训练集测试集样本和训练集测试集标签

X_train,X_test, y_train, y_test =cross_validation.train_test_split(train_data,train_target,test_size=0.3, random_state=0)

参考：https://www.cnblogs.com/bonelee/p/8036024.html

猜你喜欢

转载自www.cnblogs.com/machong/p/9227589.html

sklearn笔记

sklearn

ｓｋｌｅａｒｎ

sklearn02

sklearn01

Sklearn学习笔记

sklearn——TfidfVectorizer笔记

【机器学习】sklearn 笔记

sklearn笔记：AgglomerativeClustering

sklearn笔记：DBSCAN

sklearn_模型遍历

sklearn-模型评价

sklearn-交叉验证

sklearn_线性回归

sklearn-加载数据

crf sklearn_

Sklearn_入门

sklearn 翻译笔记：KNeighborsClassifier

python之sklearn学习笔记

sklearn first code 学习笔记

Sklearn学习笔记二：PCA

sklearn监督学习笔记

sklearn学习笔记之svm

sklearn学习笔记之开始

【读书笔记】sklearn翻译

sklearn笔记：决策树

Sklearn笔记：超参数优化

Sklearn笔记：度量和评分

sklearn笔记： kneighbors_graph

sklearn-数据集划分

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)