sklearn数据特征重要程度的筛选


'''


'''
from sklearn.feature_selection import SelectKBest, f_classif
import matplotlib.pyplot as plt

selector = SelectKBest(f_classif,k='all')  #或者k=3:特征的个数
'''
dateframtop1_name_x_train[predictors]  是一个dataframe结构predictors是列名的列表
dateframtop1_name_y_train   因为这里只有一列所以没有列名
'''

selector.fit(dateframtop1_name_x_train[predictors], dateframtop1_name_y_train)
scores = -np.log10(selector.pvalues_)

plt.rcParams['font.sans-serif'] = ['SimHei']  # 这两行用来显示汉字
plt.rcParams['axes.unicode_minus'] = False

plt.bar(range(len(predictors)), scores)   #画柱状图,比如三个柱子
plt.xticks(range(len(predictors)), predictors, rotation='vertical')  #这个是在每一柱子下说明名字
plt.show()

猜你喜欢

转载自blog.csdn.net/weixin_42053726/article/details/84307631