首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >用Beautifulsoup/ pubDate解析怪异现象

用Beautifulsoup/ pubDate解析怪异现象
EN

Stack Overflow用户
提问于 2010-01-31 00:19:25
回答 1查看 1.4K关注 0票数 3

我正在尝试使用Beautifulsoup来解析RSS/Podcast提要,除了我似乎不能解析'pubDate‘字段之外,一切都运行得很好。

代码语言:javascript
复制
data = urllib2.urlopen("http://www.democracynow.org/podcast.xml")
dom = BeautifulStoneSoup(data, fromEncoding='utf-8')
items = dom.findAll('item');

for item in items:
    title = item.find('title').string.strip()
    pubDate = item.find('pubDate').string.strip()

标题可以很好地解析,但当它到达pubDate时,它会说:

回溯(最近一次调用):AttributeError中的文件"",第2行:'NoneType‘对象没有属性'string’

但是,当我下载XML文件的副本并将“pubDate”重命名为其他名称,然后再次解析它时,它似乎起作用了。pubDate是Python语言中的保留变量还是什么?

谢谢,

G

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2010-01-31 00:26:12

它适用于item.find('pubdate').string.strip()。为什么不使用feedparser呢?

票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/2168516

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档