如何从这些节点获取链接:
script <- getURL("www.r-bloggers.com")
doc <- htmlParse(script)
li <- getNodeSet(doc, "//ul[@class='xoxo blogroll']")提前感谢您的任何提示。
发布于 2012-04-05 11:47:48
您可以提取a元素并对其调用xmlGetAttr。
library(RCurl)
library(XML)
script <- getURL("www.r-bloggers.com")
doc <- htmlParse(script)
li <- getNodeSet(doc, "//ul[@class='xoxo blogroll']//a")
sapply(li, xmlGetAttr, "href")您也可以直接使用xpathApply:
xpathSApply(doc,
"//ul[@class='xoxo blogroll']//a",
xmlGetAttr, "href"
)https://stackoverflow.com/questions/10020501
复制相似问题