首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >雅虎财经新闻pubDate不能被红宝石访问

雅虎财经新闻pubDate不能被红宝石访问
EN

Stack Overflow用户
提问于 2018-06-14 23:50:13
回答 2查看 85关注 0票数 0

我能够访问雅虎财经新闻标题,但解析 pubDate 很困难,所以我只看上周的新闻,而忽略了任何较老的

代码语言:javascript
复制
require 'nokogiri'
sym = "1313.HK"
url = "https://feeds.finance.yahoo.com/rss/2.0/headline?s=#{sym}&region=US&lang=en-US"
doc = Nokogiri::HTML(open(url))

titles = doc.css("title")
puts titles.length # works, comes back with 0-20
puts titles.text # works

pubDates = doc.css("pubDate")
puts pubDates.length #does NOT work, always 0
puts pubDates.text #does NOT work, always blank

keywordregex = "bad news"
nodes = doc.search('title') # search title tags only, for keywords
puts found_title = nodes.select{ |n| n.name=='title' && n.text =~ keywordregex } # TODO && pubDate > 7 days old 
EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2018-06-15 01:20:09

尝试使用Nokogiri:: XML,rss实际上是XML。

代码语言:javascript
复制
doc = Nokogiri::XML(open(url))
票数 0
EN

Stack Overflow用户

发布于 2018-06-15 13:52:06

XML源中的pubdate节点名称是小写的。

代码语言:javascript
复制
 > doc.css("pubdate").length
 => 7
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/50867410

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档