首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用Nokogiri将div嵌套在div元素中

使用Nokogiri将div嵌套在div元素中
EN

Stack Overflow用户
提问于 2010-11-20 18:52:00
回答 1查看 11K关注 0票数 8

对于下面的HTML,我想使用Nokogiri解析它并得到以下结果。

代码语言:javascript
复制
event_name = "folk concert 2"   
event_link = "http://www.douban.com/event/12761580/"    
event_date = "20th,11,2010"

我知道doc.xpath('//div[@class="nof clearfix"]')可以获得每个div元素,但是我应该如何继续获得像event_name这样的每个属性,尤其是date

HTML

代码语言:javascript
复制
 <div class="nof clearfix">        
          <h2><a href="http://www.douban.com/event/12761580/">folk concert 2</a> <span class="pl2">    </span></h2>
            <div class="pl intro">
              Date:25th,11,2010<br/>
            </div>
 </div>
 <div class="nof clearfix">        
          <h2><a href="http://www.douban.com/event/12761581/">folk concert </a> <span class="pl2">    </span></h2>
            <div class="pl intro">
              Date:10th,11,2010<br/>
            </div>
 </div>
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2010-11-20 19:22:51

我不知道xpath,我更喜欢使用css选择器,它们对我来说更有意义。This tutorial可能对您有用。

代码语言:javascript
复制
require 'rubygems'
require 'nokogiri'
require 'pp'

Event = Struct.new :name , :link , :date

doc = Nokogiri::HTML DATA

events = doc.css("div.nof.clearfix").map do |eventnode|
  name = eventnode.at_css("h2 a").text.strip
  link = eventnode.at_css("h2 a")['href']
  date = eventnode.at_css("div.pl.intro").text.strip
  Event.new name , link , date
end

pp events


__END__
<div class="nof clearfix">        
         <h2><a href="http://www.douban.com/event/12761580/">folk concert 2</a> <span class="pl2">    </span></h2>
           <div class="pl intro">
             Date: 25th,11,2010<br/>
           </div>
</div>
<div class="nof clearfix">        
         <h2><a href="http://www.douban.com/event/12761581/">folk concert </a> <span class="pl2">    </span></h2>
           <div class="pl intro">
             Date: 10th,11,2010<br/>
           </div>
</div>

这将输出以下内容:

代码语言:javascript
复制
[#<struct Event
  name="folk concert 2",
  link="http://www.douban.com/event/12761580/",
  date="Date: 25th,11,2010">,
 #<struct Event
  name="folk concert",
  link="http://www.douban.com/event/12761581/",
  date="Date: 10th,11,2010">]
票数 17
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/4232345

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档