机器学习-标记编码方法 - 代码天地

机器学习-标记编码方法

其他 2018-09-30 02:26:57 阅读次数: 0

在监督学习中，经常需要处理各种各样的标记。这些标记可能是数字和单词。如果标记是数字，那么算法可以直接使用它们，但是，许多情况下，标记都需要以人们可理解的形式存在，因此，通常会用单词标记训练数据集。标记编码就是要把单词标记转换成数值形式。具体代码如下所示：

#导入预处理程序包
from sklearn import preprocessing
#定义一个标记编码器
label_encoder = preprocessing.LabelEncoder()
#添加标记
input_classes = ['audi','ford','audi','toyota','ford','bmw']
#为标记编码
label_encoder.fit(input_classes)
for i, item in enumerate(label_encoder.classes_):
    print(item, '--->', i)
#遇到新的标记，就可以非常轻松转换了
labels = ['bmw','ford','audi']
Encode_label = label_encoder.fit_transform(labels)
print(Encode_label)
#通过数字反转回单词
encode_label = [2,1,0,1]
decoded_labels = label_encoder.inverse_transform(encode_label)
print(encode_label)
print(list(decoded_labels))

猜你喜欢

转载自blog.csdn.net/u012967763/article/details/79202645

机器学习-标记编码方法

【火炉炼AI】机器学习002-标记编码方法

机器学习中one-hot编码方法为什么与统计学中使用的虚拟编码方法不同

URI编码方法

91：编码方法

Embedding 编码方法

URL编码方法 encodeURIComponent（）

字符编码方法概述

记录两个编码方法

地图数据的类型及编码方法

leetcode笔记91—编码方法

php检测文件编码方法

类别型特征编码方法总结

WEB - 关于URL编码与常用编码方法

哈夫曼（Huffman）树构建方法，编码方法

js对字符串进行编码方法总结

commons-codec-1.8常用的编码方法

预处理之特征编码方法总结

经纬度编码方法推荐-plus code简介

谈谈5G的信道编码方法

Linux修改系统编码方法总结

MySql中设置utf8编码方法

python对离散变量的one-hot编码方法

这6种编码方法，你掌握了几个？

泛统计理论初探——统计编码方法简介

pytorch自带的one-hot编码方法

图像处理压缩Huffman编码方法实现

Solidity之abi.encode各编码方法使用

Java Base64编码方法详解及实例分析

mysql 查看数据库编码及修改编码方法

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

[编程题]学英语

[codeforces 1288A] Deadline 约数+模

Python的web开发

Docker在Centos 7上的部署

python编码

解决Ubuntu16.04 fatal error: json/json.h: No such file or directory

mysql并发插入

rest接口如何适应jsonp的方案

linux 终端上网设置

高数——等号两边同时求导、积分的解释

每日归档

更多

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)