
我只想提取“山毛榉谷解决方案”
当我跑的时候
html_nodes('li') %>%
html_nodes(".flexbox.empLoc") %>%
html_text() 所有的信息都出来了。比奇谷解决方案-亚特兰大,今天24小时
发布于 2019-05-30 08:17:37
还有一种使用rvest进行刮取的方法。不必在html_nodes()中传递css选择器项,您可以在html_nodes().Just中传递xpath,下面的示例如下-
page %>% html_nodes(xpath = "//*[@id='series-matches']/div[20]/div[3]/div[1]/a[1]/span")参考资料:https://blog.rstudio.com/2014/11/24/rvest-easy-web-scraping-with-r/
X路径更容易获取-
https://stackoverflow.com/questions/56368794
复制相似问题