首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >学习CountVectorizer的部分拟合

学习CountVectorizer的部分拟合
EN

Stack Overflow用户
提问于 2016-10-27 23:57:26
回答 1查看 667关注 0票数 8

CountVectorizer是否支持部分拟合?

我想使用不同批次的数据来训练CountVectorizer

EN

回答 1

Stack Overflow用户

发布于 2020-09-17 20:39:09

不,它不支持部分拟合。

但是你可以写一个简单的方法来实现你的目标:

代码语言:javascript
复制
def partial_fit(self , data):
    if(hasattr(vectorizer , 'vocabulary_')):
        vocab = self.vocabulary_
    else:
        vocab = {}
    self.fit(data)
    vocab = list(set(vocab.keys()).union(set(self.vocabulary_ )))
    self.vocabulary_ = {vocab[i] : i for i in range(len(vocab))}

from sklearn.feature_extraction.text import CountVectorizer
CountVectorizer.partial_fit = partial_fit

vectorizer = CountVectorizer(stop_words=l)
vectorizer.fit(df[15].values[0:100])
vectorizer.partial_fit(df[15].values[100:200])
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/40289243

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档