首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >文本预处理的最佳工具,包括标记化、柠檬化、停止字删除、特征向量提取?

文本预处理的最佳工具,包括标记化、柠檬化、停止字删除、特征向量提取?
EN

Data Science用户
提问于 2016-11-25 19:32:28
回答 1查看 894关注 0票数 2

对于文本处理,有很多工具,比如CoreNLP、SpaCy、NLTK、textblob等等,每个工具都提供不同的预处理功能,人们推荐不同的工具来执行不同的任务,比如NLTK,用于令牌化等等。

您推荐哪种工具来执行所有这些任务?

EN

回答 1

Data Science用户

发布于 2016-11-26 05:34:37

在这些方面,比较两个库或工具在某种程度上取决于意见。有些人更喜欢NLTK来完成几乎所有的任务。spacy也获得了相当的声誉。但是什么对你更好取决于你想做什么。在我个人的经验中,我发现NLTKgensim库是我完成所有自然语言处理任务所需要的全部。

票数 3
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/15350

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档