文档:https://scikit-learn.org/stable/modules/generated/sklearn.datasets.dump_svmlight_file.html
svmlight遵循以下数据格式:
<target> <feature:value> <feature:value>使用数据:
a = [[1,2,3],[4,5,6]]
b = [8,9]运行命令:
dump_svmlight_file(a,b,'test.txt')输出以下内容:
8 0:1 1:2 2:3
9 0:4 1:5 2:6我想知道是否有一种方法可以指定功能名称,而不是让它从0开始递增,我希望得到如下结果:
1 10:5 50:15 100:50
0 10:15 25:5 75:15
1 20:5 40:5 60:5dump_svmlight_file命令有这样的功能吗?
发布于 2019-01-18 15:31:41
不是的。dump_svmlight_file没有内置该选项。Source code
您可以使用参数zero_based指定特性名称应该从0开始还是从1开始。Documentation
我建议您不要尝试转储具有实际功能名称的文件,这会不必要地增加文件的大小。取而代之的是,将您的功能名称作为一个单独的名称,然后加入它们。
https://stackoverflow.com/questions/54235154
复制相似问题