简略的
是否有一种方法可以使用小狗来限制结果的数量--不是全局的,而是标记级的?
Backstory/use-case
自从我知道小狗的事后,我就被迷住了。我一直在考虑新的用例。今天早上,我想用它来获取来自ESPN的最新头条新闻。
ESPN似乎有这样一个无序列表:<ul class="headlines">,然后是一串列表项。
一个简单的解决办法是:
$ curl -s -S http://espn.go.com/ | pup .headlines a text{}对吗?但是,正如您所看到的,有时每个主题与交替作者都有多个链接,因此最终得到的结果是"Low“、"Anande”、"Stark“和"Dinich”( ESPN作者的姓氏)。
理想情况下,我想做这样的事情:
$ curl -s -S http://espn.go.com/ | pup .headlines li a slice{:1} text{}但这只会返回第一个结果。*\
每个<li>有多个<li>标记,所以我想检索所有的<li>项,但是将<a>标记的数量限制在每个<li>上。这个是可能的吗?
发布于 2014-10-29 18:44:05
$ curl -s -S http://espn.go.com/ | pup '.headlines li a:first-of-type text{}'https://stackoverflow.com/questions/26635752
复制相似问题