首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在rails中抓取数据时获取href页面中的内容?

在rails中抓取数据时获取href页面中的内容?
EN

Stack Overflow用户
提问于 2018-03-19 11:42:35
回答 2查看 306关注 0票数 0

我想从网站上抓取数据。在本网站中:

HTML:

代码语言:javascript
复制
<div>
 <ul>
  <li><a href="http://.../place1">Place1</a></li>
  <li><a href="http://.../place2">Place2</a></li>
 </ul>
</div>

在“http://.../place1”中:

代码语言:javascript
复制
<div>
 <p>Place 1</p>
 <img src="...">
<div>

如何使用‘Nokogiri’gem抓取href中的数据?(单击时其他页面中的数据)

当我进行研究时,我只找到在页面中爬行数据的方法。找不到如何抓取href页面中的数据。谢谢

EN

回答 2

Stack Overflow用户

发布于 2018-03-19 13:42:57

为了抓取href中的数据,您必须创建一个新的请求来抓取其中的数据。

代码语言:javascript
复制
...
# require 'open-uri'
href = 'http://.../place1'
doc = Nokogiri::HTML(open(href))
...
票数 0
EN

Stack Overflow用户

发布于 2018-03-19 14:54:45

你可以通过.css方法获取所有的链接。然后你就可以像这样爬行了

代码语言:javascript
复制
# require 'open-uri'
links = doc.css('a').map { |link| link['href'] }
links.each do |link|
  doc = Nokogiri::HTML(open(link))
end
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/49355484

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档