KDD CUP 1999数据集用onehot编码处理 - 代码天地

KDD CUP 1999数据集用onehot编码处理

编程语言 2018-05-09 22:01:24 阅读次数: 0

因为数据集的 1 2 3字段（从0开始）是分类特征字段（category feature），分类算法无法直接使用。

因此要将其转换成为数值字段。
在这里用的是one-hot encoding独热编码（或者说是1 of k encoding）

举个例子，比如某个字段有四个取值，梨，苹果，桃子，香蕉。
那么这四种分类，编码以后会转换成4个数值字段。

梨 0 0 0 0

苹果 0 1 0 0

香蕉 0 0 1 0

桃子 0 0 0 1

大该是这么个意思。

下面是原数据和处理完的数据的对照表。（这是第一条数据，normal标记成1，输出格式是label+特征字段）

数据集中的第1列，也就是红色部分，有三种取值。tcp ,icmp ,udp.转换完成以后，有三个数字代表这一列。

绿色字段的测试集加上训练集取值有70种，但随机抽样的训练数据中仅包含50种，因此用50个表示。

同理，第三个字段应该是11，但抽样的时候仅有8种，用8个表示。

其他数字字段暂不处理。

猜你喜欢

转载自blog.csdn.net/qq_29931083/article/details/80252410

KDD CUP 1999数据集用onehot编码处理

KDD CUP 99 数据集

KDD CUP 99数据集分析

KDD Cup 风力发电数据集

KDD CUP99数据集预处理

1999 KDD Cup 网络流量异常检测大赛特征

kdd cup 2019

KDD CUP99数据集的knn算法检测

KDD CUP 2009年数据集介绍及链接

KDD Cup 99网络入侵检测数据的分析

KDD_cup99 pytorch

KDD1999 数据集

三届（2012、2011、2009）KDD Cup内容、数据源和论文

阿里再次主办大数据世界杯， KDD Cup2020正式开赛

关于2020KDD-CUP曝光公平性竞赛的数据解读

KDD CUP 2023 多语言购物会话推荐数据竞赛正式启动

KDD CUP 2017 回顾总结

用AI算法预测空气质量，阿里妈妈选手斩获KDD Cup 2018 三项大奖

KDD Cup 2018 冠军团队思路分享

PaddlePaddle实战｜ KDD Cup Regular ML Track 基线实现解析

KDD Cup 2019 The 5th AutoML Challenge 开源

KDD Cup 2020 去偏推荐之旅协同过滤

[当人工智能遇上安全] 6.基于机器学习的入侵检测和攻击识别——以KDD CUP99数据集为例

KDD CUP 2018 | 北京监测站点空气质量可视化分析

全球邀请开发者滴滴启动KDD Cup 2020强化学习挑战赛

2020KDD-CUP阿里天池一篇baseline复现debiasingRush（三）

2020KDD-CUP阿里天池一篇baseline复现debiasingRush（二）

2020KDD-CUP阿里天池一篇baseline复现debiasingRush（一）

KDD Cup 2020多模态召回比赛季军方案与广告业务应用

KDD Cup 2020 Debiasing比赛冠军技术方案及在美团广告的实践

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)