首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何更改Xidel中导出变量的顺序?

如何更改Xidel中导出变量的顺序?
EN

Stack Overflow用户
提问于 2014-10-14 13:36:37
回答 2查看 689关注 0票数 1

我正在使用Xidel从网页上抓取信息,并且我被困在以不同于页面上的顺序导出信息。

示例:

代码语言:javascript
复制
<tr>
<td></td>
<td></td>
<td></td>
<td><a><font><b>{ location:=. }</b></font>{ title:=. }</a></td>
<td>{ dates:=. }</td>
<td></td>
</tr>

此代码将导出为标题,然后导出为副标题。在Xidel中有什么方法可以改变顺序吗?

EN

回答 2

Stack Overflow用户

发布于 2014-10-14 14:44:06

这可能很简单,就像:

代码语言:javascript
复制
xidel -q page.html -e subtitle:=//h2,title:=//h1

类似下面的代码(带有几个"-e“参数)也可以工作,但像前面的代码一样,它将首先对所有副标题进行分组,然后对页面上的所有标题进行分组,这可能不是您想要的……

代码语言:javascript
复制
xidel -q page.html -e "<div><h2>{subtitle:=.}</h2></div>+" -e "<div><h1>{title:=.}</h1></div>+" 

AFAIK,在你的例子中,Xidel中没有排序功能。但是您可以编写一个脚本,在其中将值保存为env。带有xidel --output-format cmd (如果是Windows)的变量,然后(按正确的顺序)回显/处理这些变量/值。

Dirkk给了一个很好的建议(不要分组),你的线条可能是这样的:

代码语言:javascript
复制
xidel -q page.html --xquery "for $i in //div return (concat('sub:=',$i/h2), concat('title:=',$i/h1))"
票数 0
EN

Stack Overflow用户

发布于 2014-10-15 01:43:59

我从来没有使用过这个工具,但是快速浏览一下文档,发现它支持XQuery,我想下面的代码应该可以工作:

代码语言:javascript
复制
xidel -q page.html --xquery "for $div in //div return ($div/h2, $div/h1)" --output-format xml 

这假设你的页面中有几个这样的div元素,并且想要首先对所有带有字幕的标题进行排序,即不是所有的字幕都首先排序。而且,由于您没有给出更具体的XML示例,它只是选择所有div并遍历它们-在实际的HTML中,您可能需要更具特征的特性(如id属性)。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/26353321

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档