首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >sklearn中的CountVectorizer(binary=True)和n CountVectorizer(binary=False)有什么不同

sklearn中的CountVectorizer(binary=True)和n CountVectorizer(binary=False)有什么不同
EN

Stack Overflow用户
提问于 2019-06-26 20:50:20
回答 1查看 1.3K关注 0票数 1

我使用定义ngram_vectorizer = CountVectorizer(binary=True)和ngram_vectorizer = CountVectorizer(binary=False)来运行我的脚本

混淆矩阵的结果对于两者来说是不同的。可以帮助我理解二进制是做什么的?

EN

回答 1

Stack Overflow用户

发布于 2019-12-07 00:21:42

如果您设置了binary=True,那么CountVectorizer将不再使用术语/标记的计数。如果标记存在于文档中,则为1;如果不存在,则无论其出现频率如何,均为0。因此,您将只处理二进制值。默认情况下,为binary=False

请参阅usage examples here

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/56773265

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档