我正在使用rvest包从http://www.wp.pl/网站下载信息,但我只对带有特殊标记data-cluster的链接感兴趣
<a data-cluster="3" href="http://wp.tv/i,nowe-prawo-drogowe-juz-latem-nowelizacja-czeka-na-podpis,mid,1659098,klip.html" title="Bat na kierowców już latem? "To będzie trzęsienie ziemi"" data-st-mtype="3">
<img src="http://y.wpimg.pl/i/ivar/G/201503/1426152344_a.jpg" data-src="http://y.wpimg.pl/i/ivar/G/201503/1426152344_a.jpg" alt="" height="191" width="332">
<h3>Bat na kierowców już latem? "To będzie trzęsienie ziemi"</h3>
</a>关于如何在html_nodes()函数中指定选择器有什么想法吗?
发布于 2015-03-13 18:04:43
为什么不直接使用xpath:
library(rvest)
html('<a blah="1">123</a><a href="">345</a><a href="">789</a><a blah="2" href="">345</a>') %>%
html_nodes(xpath = '//a[@blah]')
# [[1]]
# <a blah="1">123</a>
#
# [[2]]
# <a blah="2" href="">345</a>
#
# attr(,"class")
# [1] "XMLNodeSethttps://stackoverflow.com/questions/29029350
复制相似问题