我正在尝试使用命令行中的weka来运行一些分类。在此链接weka-Primer-命令行中,有以下创建测试和培训集的示例:
java weka.filters.supervised.instance.StratifiedRemoveFolds -i data/soybean.arff -o soybean-train.arff \
-c last -N 4 -F 1 -V
java weka.filters.supervised.instance.StratifiedRemoveFolds -i data/soybean.arff -o soybean-test.arff \
-c last -N 4 -F 1这段代码是否应该将3/4的数据用于培训,1/4用于测试集?在我看来,只有一倍的全部数据(从最后一个,因为-V)将分配给培训,只有1倍的测试。我说的对吗?我需要3/4的训练数据和1/4的测试数据。
发布于 2012-08-09 13:06:20
文档中的代码是正确的,将3/4的数据放在火车集中,1/4放在测试集中。这些选择意味着以下几点:
-N:应该有4倍,这意味着数据被分成4个相等的、不重叠的部分。-F:应选择这些部件/折叠中的第一个-V:逆选择因此,创建火车组的第一条线的工作原理如下:
只需选择第一个折叠,即数据的1/4,即可创建测试。
https://stackoverflow.com/questions/11879737
复制相似问题