我正在尝试使用Beautifulsoup来解析RSS/Podcast提要,除了我似乎不能解析'pubDate‘字段之外,一切都运行得很好。
data = urllib2.urlopen("http://www.democracynow.org/podcast.xml")
dom = BeautifulStoneSoup(data, fromEncoding='utf-8')
items = dom.findAll('item');
for item in items:
title = item.find('title').string.strip()
pubDate = item.find('pubDate').string.strip()标题可以很好地解析,但当它到达pubDate时,它会说:
回溯(最近一次调用):AttributeError中的文件"",第2行:'NoneType‘对象没有属性'string’
但是,当我下载XML文件的副本并将“pubDate”重命名为其他名称,然后再次解析它时,它似乎起作用了。pubDate是Python语言中的保留变量还是什么?
谢谢,
G
发布于 2010-01-31 00:26:12
它适用于item.find('pubdate').string.strip()。为什么不使用feedparser呢?
https://stackoverflow.com/questions/2168516
复制相似问题