首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >资源路透社找不到

资源路透社找不到
EN

Stack Overflow用户
提问于 2018-10-26 16:19:04
回答 5查看 4K关注 0票数 3

在安装时,我使用的是windows系统python 3.7:

代码语言:javascript
复制
import nltk
nltk.download('reuters')

它没有问题要导入,而且我已经在cmd中安装了nltk。

但当我执行守则时:

代码语言:javascript
复制
import matplotlib.pyplot as plt
from collections import Counter
from nltk.corpus import reuters
import re
import spacy
nlp = spacy.load('en', disable=['parser', 'tagger'])
reuters_fileids = reuters.fileids()  
reuters_nlp = [nlp(re.sub('\s+',' ', reuters.raw(i)).strip()) for i in reuters_fileids[:100]]
label_counter = Counter()

它有一些错误,我不知道如何修复它.但是,代码在我的MacBook上运行得很好--我想知道WindowsSystemP.S是如何使用anaconda的,并且在windows计算机上,anaconda安装在E:\上。

代码语言:javascript
复制
Resource reuters not found.
  Please use the NLTK Downloader to obtain the resource:

  >>> import nltk
  >>> nltk.download('reuters')

  Searched in:
    - 'C:\\Users\\user/nltk_data'
    - 'C:\\nltk_data'
    - 'D:\\nltk_data'
    - 'E:\\nltk_data'
    - 'E:\\Anaconda\\nltk_data'
    - 'E:\\Anaconda\\share\\nltk_data'
    - 'E:\\Anaconda\\lib\\nltk_data'
    - 'C:\\Users\\user\\AppData\\Roaming\\nltk_data'
EN

回答 5

Stack Overflow用户

回答已采纳

发布于 2018-10-28 15:11:54

在你的新环境里你没有语料库。

按照错误消息中的建议下载该语料库:

代码语言:javascript
复制
>>> from nltk.corpus import reuters

>>> import nltk
>>> nltk.download('reuters')
[nltk_data] Downloading package reuters to
[nltk_data]     /Users/liling.tan/nltk_data...
True

>>> reuters.words()
['ASIAN', 'EXPORTERS', 'FEAR', 'DAMAGE', 'FROM', 'U', ...]
>>> reuters.sents()
[['ASIAN', 'EXPORTERS', 'FEAR', 'DAMAGE', 'FROM', 'U', '.', 'S', '.-', 'JAPAN', 'RIFT', 'Mounting', 'trade', 'friction', 'between', 'the', 'U', '.', 'S', '.', 'And', 'Japan', 'has', 'raised', 'fears', 'among', 'many', 'of', 'Asia', "'", 's', 'exporting', 'nations', 'that', 'the', 'row', 'could', 'inflict', 'far', '-', 'reaching', 'economic', 'damage', ',', 'businessmen', 'and', 'officials', 'said', '.'], ['They', 'told', 'Reuter', 'correspondents', 'in', 'Asian', 'capitals', 'a', 'U', '.', 'S', '.', 'Move', 'against', 'Japan', 'might', 'boost', 'protectionist', 'sentiment', 'in', 'the', 'U', '.', 'S', '.', 'And', 'lead', 'to', 'curbs', 'on', 'American', 'imports', 'of', 'their', 'products', '.'], ...]

或者,您也可以从命令行下载该语料库:

代码语言:javascript
复制
$ python3 -m nltk.downloader reuters
/Library/Frameworks/Python.framework/Versions/3.6/lib/python3.6/runpy.py:125: RuntimeWarning: 'nltk.downloader' found in sys.modules after import of package 'nltk', but prior to execution of 'nltk.downloader'; this may result in unpredictable behaviour
  warn(RuntimeWarning(msg))
[nltk_data] Downloading package reuters to
[nltk_data]     /Users/liling.tan/nltk_data...
[nltk_data]   Package reuters is already up-to-date!

另见:How do I download NLTK data?

票数 0
EN

Stack Overflow用户

发布于 2021-02-24 00:35:16

解压缩你的文件。您可以在google中使用以下命令,在该命令中,-d之后的相对路径将给出应该解压缩文件的位置。

代码语言:javascript
复制
unzip /root/nltk_data/corpora/reuters.zip -d /root/nltk_data/corpora
票数 9
EN

Stack Overflow用户

发布于 2018-11-18 18:25:35

如果您的语料库已经下载,而您仍然收到相同的错误,因为该语料库是以zip的形式下载的。只需转到nltk_data目录并解压缩它。也不愿再尝试执行您的代码。

票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/53012736

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档