类别变量赋予唯一的数字ID

为每个类别变量赋予唯一的数字ID

sklearn.preprocessing.LabelEncoder的使用

from sklearn import preprocessing
from sklearn.ensemble import GradientBoostingRegressor
# from sklearn import cross_validation, metrics
from sklearn.model_selection import GridSearchCV
from sklearn.model_selection import train_test_split
import warnings
warnings.filterwarnings("ignore")
import time


encoder=["model"]
print("encoding...")
col_encoder = preprocessing.LabelEncoder()
col_encoder.fit(train_sales_data["model"])
train_sales_data["model"] = col_encoder.transform(train_sales_data["model"])

原始如下:
在这里插入图片描述
转换后效果如下:
在这里插入图片描述

发布了123 篇原创文章 · 获赞 54 · 访问量 12万+

猜你喜欢

转载自blog.csdn.net/qq_41940950/article/details/102590685
今日推荐