首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >mahout分类文本输入向量化

mahout分类文本输入向量化
EN

Stack Overflow用户
提问于 2012-09-04 17:32:29
回答 1查看 503关注 0票数 1

我正在尝试用mahout构建一个分类器。在模型构建之后。我必须将目标文档“输入”到模型中,并获得分类结果。

我检查了mahout源代码中的测试用例,它使用了DenseVector,它有固定数量的字段。但是,我使用mahout对文本文档进行分类,输入的是一些字符串(或包含字符串的数组)。如何将其转换为有效的Vector实例。

我尝试了StaticWordEncoder和RandomAccessSparseVector,但结果不正确。找不到原因。有点绝望。

EN

回答 1

Stack Overflow用户

发布于 2012-09-04 17:35:45

您必须将文档解析为单词,并从这些单词中填充向量。

我建议在尝试之前先阅读像Mahout In Action这样的内容,以获得更多的背景知识。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/12260585

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档