问用Beautifulsoup/ pubDate解析怪异现象
EN

Stack Overflow用户

提问于 2010-01-31 00:19:25

回答 1查看 1.4K关注 0票数 3

我正在尝试使用Beautifulsoup来解析RSS/Podcast提要，除了我似乎不能解析'pubDate‘字段之外，一切都运行得很好。

data = urllib2.urlopen("http://www.democracynow.org/podcast.xml")
dom = BeautifulStoneSoup(data, fromEncoding='utf-8')
items = dom.findAll('item');

for item in items:
    title = item.find('title').string.strip()
    pubDate = item.find('pubDate').string.strip()

标题可以很好地解析，但当它到达pubDate时，它会说：

回溯(最近一次调用)：AttributeError中的文件""，第2行：'NoneType‘对象没有属性'string’

但是，当我下载XML文件的副本并将“pubDate”重命名为其他名称，然后再次解析它时，它似乎起作用了。pubDate是Python语言中的保留变量还是什么？

谢谢,

python

beautifulsoup

回答 1

Stack Overflow用户

回答已采纳

发布于 2010-01-31 00:26:12

它适用于item.find('pubdate').string.strip()。为什么不使用feedparser呢？

票数 3

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/2168516

复制

相似问题

问用Beautifulsoup/ pubDate解析怪异现象
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问用Beautifulsoup/ pubDate解析怪异现象EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问用Beautifulsoup/ pubDate解析怪异现象
EN