我正在尝试用mahout构建一个分类器。在模型构建之后。我必须将目标文档“输入”到模型中,并获得分类结果。
我检查了mahout源代码中的测试用例,它使用了DenseVector,它有固定数量的字段。但是,我使用mahout对文本文档进行分类,输入的是一些字符串(或包含字符串的数组)。如何将其转换为有效的Vector实例。
我尝试了StaticWordEncoder和RandomAccessSparseVector,但结果不正确。找不到原因。有点绝望。
发布于 2012-09-04 17:35:45
您必须将文档解析为单词,并从这些单词中填充向量。
我建议在尝试之前先阅读像Mahout In Action这样的内容,以获得更多的背景知识。
https://stackoverflow.com/questions/12260585
复制相似问题