常用的数据格式汇总

1、libsvm数据格式

libsvm使用的训练数据和检验数据文件格式如下:

[label] [index1]:[value1] [index2]:[value2] … [label] [index1]:[value1] [index2]:[value2] …

label  目标值,就是说class(属于哪一类),就是你要分类的种类,通常是一些整数。

index 是有顺序的索引,通常是连续的整数。就是指特征编号,必须按照升序排列

value 就是特征值,用来train的数据,通常是一堆实数组成。

即:

目标值 第一维特征编号:第一维特征值 第二维特征编号:第二维特征值 …目标值 第一维特征编号:第一维特征值 第二维特征编号:第二维特征值 …

例如:5 1:0.6875 2:0.1875 3:0.015625 4:0.109375

表示训练用的特征有4维,第一维是0.6875,第二维是0.1875,第三维是0.015625,第四维是0.109375  目标值是5

注意:训练和测试数据的格式必须相同,都如上所示。测试数据中的目标值是为了计算误差用

1.1、libsvm数据格式制作

该过程可以自己使用excel或者编写程序来完成,也可以使用网络上FormatDataLibsvm.xls来完成。FormatDataLibsvm.xls使用说明:

a.先将数据按照下列格式存放(注意label放最后面):

value1 value2 … labelvalue1 value2 … label

b.然后将以上数据粘贴到FormatDataLibsvm.xls中的最上角单元格,接着工具->宏->执行FormatDataToLibsvm宏。就可以得到libsvm要求的数据格式。

c当然有可以写代码进行转换,下面有链接,可以看下具体怎么转换,但是目前各种语言基本都有封装好的函数,可以直接采用。

2.Json格式

待续ing




参考链接:

1.https://www.cnblogs.com/codingmengmeng/p/6254325.html

猜你喜欢

转载自blog.csdn.net/pearl8899/article/details/80341982