我正在尝试从nltk.corpus导入停用词。我不能使用nltk.download(‘停用词’),因为我有代理问题。我在试着手动导入停用词。这就是我所做的。我从github.com下载了nltk_data,并使用nltk.data.path配置了适当的路径。但是当我尝试top运行这段代码时:
import nltk
from nltk.corpus import stopwords
print(stopwords.words('english'))我得到一个类似这样的错误。
>Resource 'corpora/stopwords' not found. Please use the NLTK
>Downloader to obtain the resource: >>> nltk.download()
>Searched in:
-'C:\\Program Files\\Anaconda3\\Lib\nltk_data'我所有的nltk数据都在上面的路径中,而且语料库文件夹中也有停用词。正如我上面所说的,我不能使用nltk.download()。我是不是漏掉了什么?
更新1
我重置了所有spyder设置,并再次运行此代码:
import nltk
from nltk.corpus import stopwords
print(stopwords.words('english'))我得到一个错误,如:
LookupError:
**********************************************************************
Resource 'corpora/stopwords' not found. Please use the NLTK
Downloader to obtain the resource: >>> nltk.download()
Searched in:
- 'C:\\Users\\586594/nltk_data'
- 'C:\\nltk_data'
- 'D:\\nltk_data'
- 'E:\\nltk_data'
- 'C:\\Program Files\\Anaconda3\\nltk_data'
- 'C:\\Program Files\\Anaconda3\\lib\\nltk_data'
- 'C:\\Users\\586594\\AppData\\Roaming\\nltk_data'
**********************************************************************我所有的nltk数据都在"C:\Program Files\Anaconda3\nltk_data“中,语料库目录中有停用词。
发布于 2019-04-15 20:28:43
我通过导入nltk并从其中下载“stopword”修复了它。
import nltk nltk.download('stopwords')
发布于 2017-08-02 20:29:47
您使用Python命令设置了nltk_data路径,不是吗?仔细查看错误消息中的路径:
-'C:\\Program Files\\Anaconda3\\Lib\nltk_data'
路径组件之间的反斜杠是双倍的,除了最后一个;你的路径中有一个文字换行符。为了避免这样的意外,当你写路径时,总是使用原始字符串。例如。
nltk.data.path.append(r"C:\Program Files\Anaconda3\Lib\nltk_data")https://stackoverflow.com/questions/45455993
复制相似问题