我已经使用apt在UbuntuServer12.04上安装了python。
但是,当我尝试下载一个语料库时,我会得到以下错误:
$ python
Python 2.7.3 (default, Feb 27 2014, 19:58:35)
[GCC 4.6.3] on linux2
Type "help", "copyright", "credits" or "license" for more information.
>>> import nltk
>>> nltk.download('brown')
[nltk_data] Error loading brown: HTTP Error 401: Authorization
[nltk_data] Required
False我是不是漏掉了一些配置或附加的软件包?
发布于 2014-09-23 10:21:25
Ubuntu打包版本的DEFAULT_URL在downloader.py中仍然使用:
DEFAULT_URL = 'http://nltk.googlecode.com/svn/trunk/nltk_data/index.xml'但是,当前的数据服务器是:
DEFAULT_URL = "http://nltk.github.com/nltk_data/"你当然可以从源头安装或者..。修改已经安装的版本,以指向新服务器,如下所示:
sudo perl -pi -e 's#DEFAULT_URL = .*#DEFAULT_URL = "http://nltk.github.com/nltk_data/"#' /usr/lib/python2.7/dist-packages/nltk/downloader.py然后,您可以安装“褐色”语料库:
$ python
Python 2.7.6 (default, Mar 22 2014, 22:59:56)
[GCC 4.8.2] on linux2
Type "help", "copyright", "credits" or "license" for more information.
>>> import nltk
>>> nltk.download('brown')
[nltk_data] Downloading package 'brown' to /home/sylvain/nltk_data...
[nltk_data] Unzipping corpora/brown.zip.
True
>>> from nltk.corpus import brown
>>> brown.words()
['The', 'Fulton', 'County', 'Grand', 'Jury', 'said', ...]
>>> 发布于 2014-10-17 22:25:46
可以在不更改源代码的情况下修复此问题。在python中创建一个自定义的下载程序:
>>> dl = nltk.downloader.Downloader("http://nltk.github.com/nltk_data/")然后打开GUI对话框:
>>> dl.download()检查您对下载目录有写访问权,并下载所需的内容。
发布于 2015-11-08 09:42:14
pip install nltk --upgrade这个更新nltk,然后nltk.download()再次工作。
https://askubuntu.com/questions/527388
复制相似问题