有人告诉我如何通过词袋概念将文本文档转换为向量吗?如何在java中实现向量空间模型?实际上,我已经对设置词干过程的文本数据进行了预处理,现在我必须使用bag-of-words concept.Does将这些文本文档转换为矢量化模型。有人能帮我吗?如何在java中实现?
发布于 2015-01-27 21:05:52
建立一个字典。
您为每个单词分配一个惟一的整数索引,这是VSM中的维度。
https://stackoverflow.com/questions/28166869
相似问题