LabelEncoder使用方法及处理多列文本的方法 - 代码天地

LabelEncoder使用方法及处理多列文本的方法

其他 2021-03-24 03:11:14 阅读次数: 0

大多数机器学习算法跟数字打交道，所以有时把这些文本标签转换为数字。
Scikit-Learn 为这个任务提供了一个转换器 LabelEncoder ：

from sklearn.preprocessing import LabelEncoder
e=LabelEncoder()
hc= a['ocean_proximity']
hce=e.fit_transform(hc)
hce
hce.shape

在这里插入图片描述

训练转换后的文本会按相同描述分到一个数字。
该方法只适合转换一列的文本数据，转换多列的文本数据会报错，需要使用factorize() 方法。

```pythonhce, hcg = housing_cat.factorize()hce[:10]

因此建议大家多使用factorize方法。可以避免很多报错。

猜你喜欢

转载自blog.csdn.net/lisenby/article/details/107983254

LabelEncoder使用方法及处理多列文本的方法

scikit-learn labelencoder 同时处理多列

文本处理工具awk使用方法

文本处理工具 sed 使用方法

词库列阵的作用与使用方法

Python之sklearn：LabelEncoder函数简介(编码与编码还原)、使用方法、具体案例之详细攻略

最新kindeditor富文本的使用方法

Typora文本工具简单使用方法

多参数时Torchsummary的使用方法

EXCEL处理|pandas使用方法记录

Oracle列转行函数LISTAGG() WITHIN GROUP ()的使用方法

QueryWarpper的使用方法，MyBatics Plus的查询方法处理

kindeditor富文本框使用方法

vim文本编辑器的基本使用方法

vue2-editor富文本基础使用方法

富文本编辑器：KindEdit使用方法

hanlp提取文本关键词的使用方法记录

富文本编辑器ueditor使用方法

微信小程序富文本处理/wxParse微信小程序富文本处理插件使用方法

Devexpress GridControl中 repositoryItemCheckEdit作为选择列以及作为显示列的使用方法

Tensorflow、Pytorch、Keras的多GPU使用方法

nacos+springboot的多环境使用方法

多平台开源软件 KeePassXC 使用方法详解

多页组件(TPageControl)使用方法详解实例

Linux：screen使用方法精要和多屏工作

python字典多键值及重复键值的使用方法(详解)

sed处理文本方法

文本特征处理方法

数据预处理之将类别数据数字化的方法 —— LabelEncoder VS OneHotEncoder

数据预处理之将类别数据数字化的方法 —— LabelEncoder

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)