首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >替代TfidfVectorizer

替代TfidfVectorizer
EN

Stack Overflow用户
提问于 2020-06-02 05:42:24
回答 1查看 1.5K关注 0票数 1

TfidfVectorizer模块的sklearn.feature_extraction.text函数有什么可替代的吗?我听说过fastText和GloVe,但没有找到一个很好的扩展,说明如何使用它来向量化文本。

编辑:基本上我有一个叫做“叙述”的功能,它由英语句子组成。为了将其输入到任何ML算法中,我必须将其转换为数字矩阵表示。TfIdf是一种方法。我还有别的办法可以试试吗?(可能或不可能在滑雪板下)

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-06-02 09:32:15

您正在寻找的是所谓的文本嵌入,例如见。本质上,对于您的叙事功能,您希望将序列转换为向量,因此是seq_to_vec。TfIdf只是最简单的方法之一,它会产生稀疏(更多的组件是=0,而不是0)。我建议你把这里看作一个好的起点。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/62145587

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档