上一次最后的结果就是一个分类的值,可能让大家大失所望,这一次会给大家一个比较完美的答案,这就是Evaluation类,这次只讲一下最简单的用法,首先初始化一个Evaluation对象,Evaluation类没有无参的构造函数,一般用Instances对象作为构造函数的参数。
如果没有分开训练集和测试集,可以使用Cross Validation方法,Evaluation中crossValidateModel方法的四个参数分别为,第一个是分类器,第二个是在某个数据集上评价的数据集,第三个参数是交叉检验的次数(10是比较常见的),第四个是一个随机数对象。
如果有训练集和测试集,可以使用Evaluation 类中的evaluateModel方法,方法中的参数为:第一个为一个训练过的分类器,第二个参数是在某个数据集上评价的数据集。例中我为了简单用训练集再次做为测试集,希望大家不会糊涂。
提醒大家一下,使用crossValidateModel时,分类器不需要先训练,这其实也应该是常识了。
Evaluation中提供了多种输出方法,大家如果用过weka软件,会发现方法输出结果与软件中某个显示结果的是对应的。例中的三个方法toClassDetailsString,toSummaryString,toMatrixString比较常用。
package com.cizito.weka.study; import java.util.Random; import weka.classifiers.Evaluation; import weka.classifiers.lazy.IB1; import weka.classifiers.trees.J48; import weka.core.Instances; import weka.core.converters.ConverterUtils.DataSource; /** * @author zhangwei * */ public class EvaluationTest { private Instances m_instances = null; /** * @param args */ public static void main(String[] args) throws Exception{ EvaluationTest etest = new EvaluationTest(); etest.getFileInstances( "D:/ProgramFiles/Weka-3-6/data/contact-lenses.arff"); //etest.crossValidation(); //System.out.println( "***********************************\n\n" ); etest.evaluateTestData(); } public void getFileInstances( String fileName ) throws Exception { DataSource frData = new DataSource( fileName ); m_instances = frData.getDataSet(); m_instances.setClassIndex( m_instances.numAttributes() - 1 ); } public void crossValidation() throws Exception { J48 classifier = new J48(); //NaiveBayes classifier = new NaiveBayes(); //SMO classifier = new SMO(); Evaluation eval = new Evaluation( m_instances ); eval.crossValidateModel( classifier, m_instances, 10, new Random(1)); System.out.println(eval.toClassDetailsString()); System.out.println(eval.toSummaryString()); System.out.println(eval.toMatrixString()); } public void evaluateTestData() throws Exception { //J48 classifier = new J48(); IB1 classifier = new IB1(); //NaiveBayes classifier = new NaiveBayes(); //SMO classifier = new SMO(); classifier.buildClassifier( m_instances ); Evaluation eval = new Evaluation( m_instances ); eval.evaluateModel( classifier, m_instances ); System.out.println(eval.toClassDetailsString()); System.out.println(eval.toSummaryString()); System.out.println(eval.toMatrixString()); } }