首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >apache mahout中的nGrams

apache mahout中的nGrams
EN

Stack Overflow用户
提问于 2011-12-20 18:17:13
回答 1查看 804关注 0票数 3

我正在通过apache mahout运行朴素贝叶斯分类器算法。在训练和运行算法的实例时,我们可以选择设置gram大小。

将我的n-Gram大小从1更改为2,会极大地改变结果分类。这一切为什么要发生?n-Grams大小是如何在结果中产生巨大变化的?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2011-12-20 20:16:13

1-gram是单词。2-gram(或双字母组)是成对的单词。这就像根据“美国”和“美国”或“美国”的存在对文档进行分类。使用二元语法可能会有一些空间和性能影响,但可能会比1-gram提供更好的结果。

票数 6
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/8573882

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档