文章/答案/技术大牛

发布

社区首页 >问答首页 >sklearn中的CountVectorizer(binary=True)和n CountVectorizer(binary=False)有什么不同

问sklearn中的CountVectorizer(binary=True)和n CountVectorizer(binary=False)有什么不同
EN

Stack Overflow用户

提问于 2019-06-26 20:50:20

回答 1查看 1.3K关注 0票数 1

我使用定义ngram_vectorizer = CountVectorizer(binary=True)和ngram_vectorizer = CountVectorizer(binary=False)来运行我的脚本

混淆矩阵的结果对于两者来说是不同的。可以帮助我理解二进制是做什么的？

发布于 2019-12-07 00:21:42

如果您设置了binary=True，那么CountVectorizer将不再使用术语/标记的计数。如果标记存在于文档中，则为1；如果不存在，则无论其出现频率如何，均为0。因此，您将只处理二进制值。默认情况下，为binary=False。

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/56773265

复制

相似问题

问sklearn中的CountVectorizer(binary=True)和n CountVectorizer(binary=False)有什么不同EN