首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >从变量Python (urllib2.urlopen) + Beautifulsoup4打开链接

从变量Python (urllib2.urlopen) + Beautifulsoup4打开链接
EN

Stack Overflow用户
提问于 2015-04-19 08:22:19
回答 2查看 651关注 0票数 1

我正在使用Python2.7+ urllib2 + Beautifulsoup4

当我有绳子时:

soup = BeautifulSoup(urllib2.urlopen('http://www.some-website.com', 'html'))

它工作得很好,但是当我将URl移动到变量时,它就不能工作了。

代码语言:javascript
复制
variable = 'http://www.some-website.com'
soup = BeautifulSoup(urllib2.urlopen(variable, 'html'))

错误:

代码语言:javascript
复制
edit: errcode is: File "C:\Python27\lib\urllib2.py", line 285, in get_type
  raise ValueError, "unknown url type: %s" % self.__original
    ValueError: unknown url type: api/Abc-Abc/def/7/179 –

解出

问题是其中一个链接只是对服务器数据库的引用。

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2015-04-19 08:34:56

代码语言:javascript
复制
# Note: Make sure you add live website like http://vaibhavmule.com not http://some-website.com
variable = 'http://www.some-website.com' # Do not forget 'http' prefix here

# As you used 'html' which is not parser library.
soup = BeautifulSoup(urllib2.urlopen(variable))  

这应该能行。

用于使用解析器库的参考文献

票数 1
EN

Stack Overflow用户

发布于 2015-04-19 09:30:12

下列措施应能发挥作用:

代码语言:javascript
复制
var='http://www.example.com'
variable = urllib2.urlopen(var).read()
from BeautifulSoup import BeautifulSoup
Soup = BeautifulSoup()
import BeautifulSoup
soup = Soup(variable)
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/29727538

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档