机器学习笔记(二)-特征预处理

其他 2019-03-23 17:44:45 阅读次数: 0

数据预处理

(一)对数值型数据的预处理主要包括：归一化，标准化，缺失值

类别型数据：one-hot编码

时间类型：时间的切分

所用到的API ：sklearn.preprocessing

(二)归一化（通过对原始数据进行变换把数据映射到默认的0-1之间）

目的是使得某一个特征不会对最终结果造成更大的影响。

缺点是当数据中的异常点较多时，对最终的归一化的结果影响较大，因此归一化只适用于传统数据量较小的场景。

(三)标准化（用的最多）

在样本足够多的情况下比较稳定，适合现代嘈杂大数据场景。

实例：

from sklearn.preprocessing import StandardScaler

def standard():
    """"
    标准化
    """
    std=StandardScaler()
    data=std.fit_transform([[90,2,10,40],[60,4,15,45],[75,3,13,46]])
    print(data)    # 每列特征的平均值为0，标准差为1
    return None


if __name__=='__main__':
    # mm()
    standard()

View Code

运行结果：

(四)如何处理数据中的缺失值

实例：

from sklearn.preprocessing import Imputer
import  numpy as np

def imp():
    """
    缺失值处理
    """
    im = Imputer(missing_values='NaN',strategy='mean',axis=0)    # 按列的平均值进行填补
    data=im.fit_transform([[1,2],[np.nan,3],[3,6]])
    print(data)
    return None

if __name__=='__main__':
  
    imp()

View Code

运行结果：

猜你喜欢

转载自www.cnblogs.com/doctorXiong/p/10584428.html

机器学习笔记(二)-特征预处理

机器学习 - 特征预处理

机器学习---特征预处理

【机器学习】特征预处理

机器学习sklearn—数据的特征预处理

【机器学习】数据预处理与特征工程

机器学习——数据特征预处理

机器学习 sklearn 特征预处理

机器学习02:特征预处理

机器学习特征工程之特征预处理

机器学习入门（三）：特征工程——特征预处理

机器学习基础之《特征工程（3）—特征预处理》

机器学习自学笔记（二）：数据预处理

(二)机器学习笔记之数据预处理

天池赛学习笔记——使用sklearn+机器学习进行分类/回归任务之(二)数据集划分、预处理和特征工程

机器学习里数据预处理及特征工程

机器学习 | 特征工程（一）- 数据预处理

机器学习总结——数据预处理和特征工程

机器学习里数据预处理及特征工程总结

机器学习实践（四）—sklearn之特征预处理

机器学习 --2 特征预处理之数据将维

机器学习之特征工程-数据预处理

机器学习数据预处理（特征值转化）

机器学习sklearn之数据预处理及特征选择

机器学习 scikit-learn 特征预处理

【机器学习之特征工程】数据预处理02

机器学习系列(3)_特征工程01数据预处理

机器学习 - 数据预处理中的特征离散化方法

机器学习特征工程之-数据预处理-1

机器学习实战基础（九）：sklearn中的数据预处理和特征工程（二）数据预处理 Preprocessing & Impute 之数据无量纲化

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)