python数据预处理和特性选择后列的映射 - 代码天地

python数据预处理和特性选择后列的映射

其他 2018-12-15 15:14:39 阅读次数: 0

我们在用python进行机器学习建模时，首先需要对数据进行预处理然后进行特征工程，在这些过程中，数据的格式可能会发生变化，前几天我遇到过的问题就是：

　　　　对数据进行标准化、归一化、方差过滤的时候数据都从DataFrame格式变为了array格式。

这样数据的列名就会消失，且进行特征选择之后列的数量也会发生改变，因此需要重新对列进行映射，为其加上列名并转化为DataFrame的格式。一般情况下可以分为三种情况：

1、对数据进行缺失值填补、编码（处理分类型变量）、二值化（处理连续型变量）一般都是按照列对数据进行处理，因此处理完之后，直接覆盖原数据即可。　　　　

data.loc[:,"Age"]= SimpleImputer(strategy="median").fit_transform(data.loc[:,"Age"].values.reshape(-1,1))

2、对数据进行标准化、归一化都是对整个特征矩阵进行处理，数据类型变为array，但是数据的列并没有发生任何改变。直接将原始的列名重新映射至处理好的数据上。

X_train1 = min_max_scaler.fit_transform(X_train)  
X_train1=pd.DataFrame(X_train1)
X_train1.columns = X_train.columns

3、在所有特征选择方法，方差，SelectKBest+各种统计量（卡方过滤、F检验、互信息法），嵌入法和包装法，都有接口get_support，该接口有属性get_support(indices=False)，参数为false的时候可以用来确定原特征矩阵中有哪些特征被选择出来，返回布尔值True或者False，如果设定indices=True，就可以确定被选择出来的特征在原特征矩阵中所在的位置的索引。

猜你喜欢

转载自www.cnblogs.com/simpleDi/p/10123322.html

python数据预处理和特性选择后列的映射

数据预处理和特征选择

数据预处理与特征选择

Python数据预处理

数据预处理--持久化预处理后的数据

数据预处理——数据特征选择

特征选择与数据预处理方法

python数据预处理练习

Python数据预处理总结

python数据预处理for knn

Python-数据预处理

Python做数据预处理

python数据预处理（入门）

python 数据预处理1

python数据预处理之缺失值简单处理，特征选择

预处理后数据的保存与读取

数据探索和预处理

数据加载和预处理

【GF6-WFV数据预处理完成后-python批处理工具——根据影像直方图读取数据最大，最小和中值】

数据预处理 Python主要数据预处理函数

【skLearn 数据预处理和特征工程】数据预处理

吴裕雄 python 机器学习——数据预处理嵌入式特征选择

python机器学习之sklearn分类、聚类、回归、模型选择、降维、数据预处理

数据预处理与特征工程总结 - 特征选择 - 嵌入法和包装法(五)

Python 电子病历（EMR）机器学习和深度学习数据预处理，医学文本标签数据预处理

python数据预处理：数据抽样

python数据预处理：数据降维

python数据预处理：数据离散化

python数据挖掘——数据预处理

Python数据挖掘之数据预处理

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)