数据预处理——独热码 - 代码天地

数据预处理——独热码

其他 2018-05-12 20:03:30 阅读次数: 2

模型原型

class sklearn.preprocessing.OneHotEncoder(n_values=’auto’,categorical_features=’all’,dtype=/, sparse=True,handle_unknown=’error’)
参数

n_values:指定每个属性的上界
- ’auto’:自动从训练数据中推断属性值取值的上界
- 一个整数:指定所有属性取值的上界
- 一个整数的数组:依次指定每个属性的上界
categorical_features:指定哪些属性需要编码独热码
- ’all’
- 一个下标的数组:指定下标的属性将编码为独热码
- 一个mask:对应为True的属性将编码为独热码
dtype:指定独热码编码的数值类型（默认为np.float）
sparse:指定结果是否为稀疏
handle_unknown:如果进行数据转换时，遇到了某个集合类型的属性，但是该属性未列入categorical_features时的情形，可以指定为
- ’error’:抛出异常
- ‘ignore’:忽略

属性

activefeatures:激活特征
featureindices:原始数据的第i个属性对应转换后数据的
(featureindices[i],featureindices[i+1])之间的属性
n_values:存放每个属性取值的种类

方法

fit(X,[,y]):训练OneHotEncoder
transform(X[,y,copy]):对原始数据执行独热码编码
fit_transform(X[,y])

示例

from sklearn.preprocessing import OneHotEncoder
X=[
    [1,2,3,4,5],
    [5,4,3,2,1],
    [3,3,3,3,3],
    [1,1,1,1,1]
]
print('before transform:\n',X)
encoder=OneHotEncoder(sparse=False)
encoder.fit(X)
print('active_features_:\n',encoder.active_features_)
print('feature_indices_:\n',encoder.feature_indices_)
print('n_values_:\n',encoder.n_values_)
print('after transform:\n',encoder.transform([[1,2,3,4,5]]))

猜你喜欢

转载自blog.csdn.net/weixin_39777626/article/details/79935926

数据预处理——独热码

数据预处理—独热编码

数据预处理-onehot独热编码

数据预处理：独热编码（One-Hot Encoding）

机器学习数据预处理之独热编码（One-Hot Encoding）

机器学习：数据预处理之独热编码（One-Hot）

机器学习数据预处理之独热编码（One-Hot Encoding）[zz]

python数据预处理：字符变量独热编码(one-hot encoding)

数据预处理之独热编码（One-Hot Encoding）

数据预处理--独热编码（One-Hot Encoding）和 LabelEncoder标签编码

机器学习之数据预处理——特征编码(标签编码，独热编码)

机器学习数据预处理1：独热编码（One-Hot）及其代码

数据预批处理-独热编码

深度学习工作笔记003---数据预处理：独热编码（One-Hot Encoding）

独热编码（One-Hot Encoding）和 LabelEncoder标签编码区别数据预处理：（机器学习） sklearn

数据预处理-定类数据处理定类离散特征转化为One-Hot-Encoding独热编码

Python机器学习-数据预处理技术（标准化处理、归一化、二值化、独热编码、标记编码）

Python机器学习-数据预处理技术标准化处理、归一化、二值化、独热编码、标记编码总结

循环神经网络（一）（文本预处理，分词，独热编码，词嵌入，keras 代码）

与FPGA相关的独热码

【火炉炼AI】机器学习001-数据预处理技术（均值移除，范围缩放，归一化，二值化，独热编码）

机器学习之数据预处理（均值移除、范围缩放、归一化、二值化、独热编码、标签编码）

第三章：数据预处理和特征工程：一、预处理 1.数据无量纲化 1.1 归一化 1.2 数据标准化 2.缺失值的处理 3.处理分类型特征独热编码 4.处理连续型特征分为多个

【实战】数据预处理练习----标准化/归一化/独热化

独热编码处理文本属性

数据预处理：独热编码（One-Hot Encoding）均值、方差与协方差矩阵矩阵论：向量范数和矩阵范数再谈机器学习中的归一化方法（Normalization Method） Sigmod/Softmax变换 Scikit-learn：数据预处理Preprocessing data

数据归一化处理和常用标签编码，独热编码

数据——数据预处理

python 独热码one hot encoding的用法

靶形数独（dfs+预处理+状态压缩）

今日推荐

周排行

小程序的背景图片

SpringBoot项目架构小实例

[多线程] Wait和Notify方法解析

第五章绘图基础（ALTWIND）

HDU 6386 Age of Moyu 【bfs】【spfa】

如何在windows上搭载PHP环境并编写运行第一个PHP代码

CF1006C 【Three Parts of the Array】

FastAdmin 增删改查在哪里？

区块链安全吗？

docker Dockerfile实战

每日归档

更多

2024-06-16(0)

2024-06-15(0)

2024-06-14(0)

2024-06-13(0)

2024-06-12(0)

2024-06-11(0)

2024-06-10(0)

2024-06-09(0)

2024-06-08(0)

2024-06-07(0)