首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Nokogiri XML to节点

Nokogiri XML to节点
EN

Stack Overflow用户
提问于 2013-01-14 01:22:27
回答 2查看 994关注 0票数 4

我正在使用Nokogiri阅读本地HTML文档,如下所示:

代码语言:javascript
复制
f = File.open(local_xml)
@doc = Nokogiri::XML(f)
f.close

@doc包含一个我可以使用at_css解析的Nokogiri XML对象。

我想用Nokogiri的XML::Node修改它,但我完全卡住了。如何使用节点方法获取此Nokogiri XML文档并使用它?

例如:

代码语言:javascript
复制
@doc.at_css('rates tr').add_next_sibling(element)

返回:

代码语言:javascript
复制
undefined method `add_next_sibling' for nil:NilClass (NoMethodError)

尽管@doc.classNokogiri::XML::Document

为了完整起见,下面是我试图编辑的标记。

代码语言:javascript
复制
<html>
<head>
<title>Exchange Rates</title>
    <link rel="stylesheet" href="style.css">
</head>
<body>
    <table class="rates">
        <tr>
            <td class="up"><div></div></td>
            <td class="date">Saturday, Jan 12</td>
            <td class="rate up">3.83</td>
        </tr>
        <tr>
            <td class="up"><div></div></td>
            <td class="date">Friday, Jan 11</td>
            <td class="rate up">3.70</td>
        </tr>
        <tr>
            <td class="down"><div></div></td>
            <td class="date">Thursday, Jan 10</td>
            <td class="rate down">3.68</td>
        </tr>
        <tr>
            <td class="down"><div></div></td>
            <td class="date">Wedensday, Jan 9</td>
            <td class="rate down">3.70</td>
        </tr>
        <tr>
            <td class="up"><div></div></td>
            <td class="date">Tuesday, Jan 8</td>
            <td class="rate up">3.66</td>
        </tr>
    </table>
</body>
</html>
EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2013-01-14 01:44:11

尝试加载为超文本标记语言,而不是XML Nokogiri::HTML(f)

没有详细介绍Nokogiri是如何工作的,我们可以说XML没有css,对吗?所以at_css方法没有意义(也许它有意义,我不知道)。因此,它应该可以作为Html加载。

更新

只是注意到一件事。你想做at_css('.rates tr')而不是at_css('rates tr'),因为这是你在css中选择类的方式。也许它现在可以和XML一起工作。

票数 2
EN

Stack Overflow用户

发布于 2013-01-14 02:26:05

这是一个如何做你想做的事情的例子。从包含要解析的f的缩短版本开始:

代码语言:javascript
复制
require 'nokogiri'

f = '
<html>
<head>
<title>Exchange Rates</title>
    <link rel="stylesheet" href="style.css">
</head>
<body>
    <table class="rates">
        <tr>
            <td class="up"><div></div></td>
            <td class="date">Saturday, Jan 12</td>
            <td class="rate up">3.83</td>
        </tr>
    </table>
</body>
</html>
'

doc = Nokogiri::HTML(f)
doc.at('.rates tr').add_next_sibling('<p>foobar</p>')

puts doc.to_html

您的代码错误地尝试查找<table>class="rates"参数。在CSS中,我们使用.rates。使用CSS的另一种方法是table[class="rates"]

您的示例没有定义您试图添加到HTML中的节点,所以我附加了<p>foobar</p>。Nokogiri将允许您从头开始构建节点并附加它,或者使用标记并添加它,或者您可以从HTML中的一个位置找到节点,将其移除,然后将其插入其他位置。

该代码输出:

代码语言:javascript
复制
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN" "http://www.w3.org/TR/REC-html40/loose.dtd">
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
<title>Exchange Rates</title>
<link rel="stylesheet" href="style.css">
</head>
<body>
    <table class="rates">
<tr>
<td class="up"><div></div></td>
            <td class="date">Saturday, Jan 12</td>
            <td class="rate up">3.83</td>
        </tr>
<p>foobar</p>
</table>
</body>
</html>

没有必要使用at_cssat_xpath来代替at。Nokogiri可以感知你正在使用的访问器的类型,并对其进行处理。同样的情况也适用于使用xpathcss而不是search。此外,at等同于search('some accessor').first,因此它会查找匹配节点的第一个匹配项。

票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/14306082

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档