我想使用数据集来训练模型。该数据集具有三种不同类型的生理数据。类型1,类型2,类型3。libSVM的格式如下:标签索引1:值1索引2:值2...
现在,我已经将类型1的标签作为1,类型2的标签为2,类型3的标签为3。所有的值都保存为1:(value)。因此,我的训练和测试文件如下所示。
1 1:值\n 1 1:值\n。。。1 1:值\n 2 1:值\n。。。2 1:值\n 3 1:值\n。。3 1:值\n
因此,我正在使用这种源文件训练svm,并使用类似的源文件进行测试。我想确认我是否正确地使用了SVM数据格式。谢谢
发布于 2016-09-15 01:50:56
LIBSVM的矢量数据集格式定义为
label feature_id1:feature_value1 feature_id2:feature_value2 ...因此,每个特征(或值)都需要有自己的唯一标识符。
示例:
假设你有三个不同的类标签1,2,3和一个由a(id=1),b(id=2),c=(id=3)组成的特征集,这是通过特征选择机制获得的。
假设我们有三个数据点d1,d2,d3,我们想要在我们的数据集中描述,例如:
2 1:0.5325 3:0.523
3 2:0.7853 3:0.6326
1 1:0.53265 2:0.5422含义:
d1包含要素a(id=1),c(id=3)d3包含要素a(id=1)和b(id=2),c(id=3)
d2包含要素b(id=2)请注意,没有必要为给定数据点中未包含的特性提供feature_id1:feature_value1。
https://stackoverflow.com/questions/39360296
复制相似问题