首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用Gensim更新TF-IDF

使用Gensim更新TF-IDF
EN

Stack Overflow用户
提问于 2018-12-26 16:53:23
回答 1查看 216关注 0票数 2

您好,我正在使用Gensim来查找文档之间的相似度,因此我对文档进行TF-IDF并计算余弦相似度。当我有新文档时,我可以使用index[tfidfvec]计算这个文档与以前文档的相似度,但是这样TF-IDF不会更新,并且在相似度计算中不考虑新词。有没有什么解决方案可以快速更新TF-IDF而无需重新计算整个矩阵,或者对我的问题有什么最好的解决方案?

EN

回答 1

Stack Overflow用户

发布于 2020-08-09 04:40:14

我认为这是不可能的。因为当您向语料库添加新文档时,TF-IDF的词汇表将发生变化,而当词汇表发生变化时,所有TF-IDF值也将发生变化,并且需要重新计算整个矩阵。但this link可能会对您有所帮助。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/53929657

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档