
请看附件中的图片。我在本地使用mahout。我已经将序列文件转换为稀疏向量,并且还将集合分为两个集合:训练集和测试集:
mahout split -i tweets-vectors/tfidf-vectors --trainingOutput train-vectors --testOutput test-vectors --randomSelectionPct 40 --overwrite --sequenceFiles -xm sequential.运行此命令mahout trainnb -i train-vectors -el -li labelindex -o model -ow -c时出现错误
发布于 2018-02-14 04:23:15
这种java.lang.ArrayIndexOutOfBoundsException通常是由于记录或向量中的字段数量错误造成的。这可能是由不正确的解析引起的(错误的分隔符,逗号分隔的文件中的逗号,等等)或者您期望的字段的另一个问题出现在错误的位置。
https://stackoverflow.com/questions/48773997
复制相似问题