给定一个像/r/pics这样的subreddit,我怎么才能抓取Ruby中的所有图像呢?
我查看了Reddit的API,但似乎没有任何东西可以解决这个问题。但是像"redditery“这样的网站已经在这么做了-- http://www.redditery.com/r/aww
发布于 2014-12-10 22:17:36
请查看nokogiri,它将能够执行此任务。
require 'open-uri'
require 'nokogiri'
doc = Nokogiri::HTML(open("http://www.reddit.com/r/aww"))
doc.css('div#siteTable').css('a').each {|x| puts x['href']}这应该输出到图像的链接(这段代码没有经过测试,但应该非常接近)
https://stackoverflow.com/questions/27395191
复制相似问题