R手册(Machine Learning)--mlr

R手册(Machine Learning)–mlr


mlr: 分类,回归,聚类,生存

summarizeColumns(obj)data.frame or Task的汇总说明
impute(obj)data.frame or Task缺失的数据进行插补
capLargeValues(obj,cols=NULL) 离群值转化

make< Type >Task : 创建任务

< Type >命名约定:
Regr为回归问题
Classifk用于二分类和多类分类问题
Surv进行生存分析,
Cluster进行聚类分析
Multilabel用于多标签分类问题
CostSens用于一般成本敏感分类

example:makeClassifTask(data, target) #data, target为数据集和目标变量

makeLearner

makeLearner(cl,predict.type = "response",predict.threshold = NULL)

参数:

cl:指定要使用的算法cl=< Type >.< R_method_name >
predict.type:response/prob/se
predict.threshold :生成类标签的阈值

train

train(learner, task,subset)生成模型,subset设置训练集(默认是全部数据)
getLearnerModel(model)将底层的学习者模型纳入mlr

predict

predict(model,task,subset)
predict(model,newdata)
calculateConfusionMatrix(pred)获得混淆矩阵
plotLearnerPrediction(learner, task)ggplot扩展

调整分类问题决策阈值

getTaskDesc(x)获得总的任务描述,查看positiv
pred2<- setThreshold(pred, threshold)重设阈值
performance(pred, measures)评估模型质量

通过参数measures=list(mse,medse,mae)指定评估指标

getDefaultMeasure(task/learner)查看默认指标
listMeasures(task)查看匹配指标


xgboost

猜你喜欢

转载自blog.csdn.net/qq_41518277/article/details/80189427