特征工程（2）-数据预处理区间缩放法 - 代码天地

特征工程（2）-数据预处理区间缩放法

其他 2018-05-08 19:03:42 阅读次数: 5

https://www.deeplearn.me/1383.html

区间缩放法原理

最常见的就是使用最大最下值来进行处理，处理的公式如下

$y=x-minmax-miny=x-minmax-min$

上述公式中 min 代表数据最小值，max 代表数据最大值

from sklearn.preprocessing import MinMaxScaler
tmp=MinMaxScaler().fit_transform(irisdata.data)
print tmp[0:5]

部分结果如下：
[[ 0.22222222 0.625 0.06779661 0.04166667]
[ 0.16666667 0.41666667 0.06779661 0.04166667]
[ 0.11111111 0.5 0.05084746 0.04166667]
[ 0.08333333 0.45833333 0.08474576 0.04166667]
[ 0.19444444 0.66666667 0.06779661 0.04166667]]
spark 中的区间缩放法

>>>from pyspark.mllib.linalg import Vectors
>>>from pyspark.sql import SQLContext
>>>sqlContext=SQLContext(sc)
>>>df = sqlContext.createDataFrame([(Vectors.dense([0.0]),), (Vectors.dense([2.0]),)], ["a"])
>>> mmScaler = MinMaxScaler(inputCol="a", outputCol="scaled")
>>> model = mmScaler.fit(df)
>>> model.transform(df).show()
+-----+------+
| a|scaled|
+-----+------+
|[0.0]| [0.0]|
|[2.0]| [1.0]|

猜你喜欢

转载自www.cnblogs.com/yuluoxingkong/p/9010308.html

特征工程（2）-数据预处理区间缩放法

特征工程与数据预处理

数据预处理与特征工程

数据预处理（特征工程）

【特征工程】数据预处理

数据预处理与特征工程总结 - 特征选择 - 嵌入法和包装法(五)

数据预处理---数据清理 & 特征工程

【skLearn 数据预处理和特征工程】数据预处理

从数据预处理到特征工程

【机器学习】数据预处理与特征工程

特征工程之数据预处理

特征工程之数据预处理（下）

简单的数据预处理和特征工程

数据预处理和特征工程

【sklearn】数据预处理+特征工程

【skLearn 数据预处理和特征工程】特征工程

特征工程的预处理

特征工程——特征预处理

数据预处理2--特征处理

数据预处理与特征工程—6.Kaggle房价预测中数据预处理与特征工程

ML - 贷款用户逾期情况分析2 - 特征工程1（数据预处理）

机器学习-Python实践Day3（特征工程--数据预处理2）

数据特征预处理

特征工程（4）-数据预处理二值化

特征工程（3）-数据预处理归一化

特征工程（1）-数据预处理标准化

特征工程（5）-数据预处理哑编码

机器学习里数据预处理及特征工程

机器学习 | 特征工程（一）- 数据预处理

机器学习总结——数据预处理和特征工程

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)