记sklearn库的使用(1)

版权声明:版权归张泽(www.zhangshengze.cn)所有 https://blog.csdn.net/weixin_43477082/article/details/84935823

本篇只只在使用,不记载原理,当字典用。排版不是很好,可以使用搜索ctrl+F

  1. PCA主成成分分析
    from sklearn.decomposition import PCA # 主成分分析算法
    pca = PCA(n_components= 5) # 选择成分5个
    pca.fit(X_train) # 训练X
    X_train = pca.fit_transform(X_train)

    在使用真是数据预测的时候这样写:
    X_test = pca.fit_transform(X_test)

    其他的方法也是如此
    from sklearn.manifold import TSNE 等方法

  2. 超参数空间搜索
    clf 是你自己的分类器
    from sklearn.model_selection import GridSearchCV
    para = {
    ‘learning_rate’:[0.008,0.01,0.013,0.05],
    ‘n_estimators’:[660,500,550],
    ‘max_features’:[2,3,4,5],
    ‘subsample’:[0.87,0.9,0.93,0.88,0.96]
    }
    grid = GridSearchCV(clf,para)
    然后可以输出grid的各种属性等知晓那些参数最佳的值,使用者值重新进行分类器分类
    同时也可以在GridSearchCV中有很多参数属性,比如cv,使用交叉验证等,可以按ctrl+B查看源码。
    3.有很多刚开始学的会发觉,分类器只输出类别,但是想输出概率,别慌:
    分类器有一个类别是
    predict_proba(),这个就是输出概率值啦

猜你喜欢

转载自blog.csdn.net/weixin_43477082/article/details/84935823