R手册(Machine Learning)–mlr
mlr: 分类,回归,聚类,生存
summarizeColumns(obj)
data.frame or Task的汇总说明
impute(obj)
data.frame or Task缺失的数据进行插补
capLargeValues(obj,cols=NULL)
离群值转化
make< Type >Task : 创建任务
< Type >命名约定:
Regr为回归问题
Classifk用于二分类和多类分类问题
Surv进行生存分析,
Cluster进行聚类分析
Multilabel用于多标签分类问题
CostSens用于一般成本敏感分类
example:makeClassifTask(data, target) #data, target为数据集和目标变量
makeLearner
makeLearner(cl,predict.type = "response",predict.threshold = NULL)
参数:
cl:指定要使用的算法cl=< Type >.< R_method_name >
predict.type:response/prob/se
predict.threshold :生成类标签的阈值
train
train(learner, task,subset)
生成模型,subset设置训练集(默认是全部数据)
getLearnerModel(model)
将底层的学习者模型纳入mlr
predict
predict(model,task,subset)
predict(model,newdata)
calculateConfusionMatrix(pred)
获得混淆矩阵
plotLearnerPrediction(learner, task)
ggplot扩展
调整分类问题决策阈值
getTaskDesc(x)
获得总的任务描述,查看positiv
pred2<- setThreshold(pred, threshold)
重设阈值
performance(pred, measures)
评估模型质量
通过参数measures=list(mse,medse,mae)指定评估指标
getDefaultMeasure(task/learner)
查看默认指标
listMeasures(task)
查看匹配指标