ejercicio de código de operación básica de sklearn

Directorio de la biblioteca

Uno, conjuntos de datos (conjunto de datos)

1.load_boston ()

from sklearn import datasets
boston = datasets.load_boston()
#加载并返回波士顿房价数据集(回归)
import pandas as pd
from sklearn import datasets
boston = datasets.load_boston()
boston_df = pd.DataFrame(boston.data,columns = boston.feature_names)
#用DataFrame将数据集格式化
boston_df.head(20)

Dos, preprocesamiento (preprocesamiento y estandarización)

1.Escalador estándar ()

from sklearn import preprocessing
#预处理和规范化
std = preprocessing.StandardScaler()
#通过去除均值并缩放到单位方差来标准化特征
std.get_params()
#获取此估计量的参数
std.set_params(copy=False)
std.fit(boston.data)
#计算均值和std以用于以后的缩放
std.mean_
#训练集中每个特征的平均值
std.var_
#训练集中每个要素的方差
std.transform(boston.data)
#通过居中和缩放执行标准化

Tres, linear_model (modelo lineal)

1.Regresión lineal ()

from sklearn import linear_model
reg = linear_model.LinearRegression()
#普通最小乘线性回归
reg
reg.fit(boston.data,boston.target)
#拟合线性模型
reg.coef_
#线性回归问题的估计系数
pred = reg.predict(boston.data)
#使用线性模型进行预测
pred[:10]

Supongo que te gusta

Origin blog.csdn.net/sgsdsdd/article/details/108896558
Recomendado
Clasificación