首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >导入nltk库时找不到语料库/停止字

导入nltk库时找不到语料库/停止字
EN

Stack Overflow用户
提问于 2017-01-12 18:19:22
回答 13查看 127K关注 0票数 69

我尝试在python2.7中导入nltk包

代码语言:javascript
复制
  import nltk
  stopwords = nltk.corpus.stopwords.words('english')
  print(stopwords[:10])

运行此命令会出现以下错误:

代码语言:javascript
复制
LookupError: 
**********************************************************************
Resource 'corpora/stopwords' not found.  Please use the NLTK
Downloader to obtain the resource:  >>> nltk.download()

因此,我打开我的python termin并执行以下操作:

代码语言:javascript
复制
import nltk  
nltk.download()

这给了我:

代码语言:javascript
复制
showing info https://raw.githubusercontent.com/nltk/nltk_data/gh-pages/index.xml

然而,这似乎并没有停止。再次运行它仍然会给我同样的错误。有什么想法出了什么问题吗?

EN

回答 13

Stack Overflow用户

发布于 2017-01-14 02:06:32

您当前正在尝试下载nltk数据中的每一项,因此这可能需要很长时间。你可以尝试只下载你需要的停用词:

代码语言:javascript
复制
import nltk
nltk.download('stopwords')

或者从命令行(多亏了Rafael Valero's answer):

代码语言:javascript
复制
python -m nltk.downloader stopwords

参考资料:

票数 121
EN

Stack Overflow用户

发布于 2018-03-01 19:35:19

Kurt Bourbaki在命令行中提到的一些here

代码语言:javascript
复制
python -m nltk.downloader stopwords
票数 37
EN

Stack Overflow用户

发布于 2018-08-22 14:14:46

您可以在控制台中单独完成此操作。

它会给你一个结果。

代码语言:javascript
复制
import nltk
nltk.download('stopwords')

当我遇到这个问题时,我使用了jupyter控制台。

票数 12
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/41610543

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档