首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >从html_node获取特定文本

从html_node获取特定文本
EN

Stack Overflow用户
提问于 2019-05-29 21:30:27
回答 1查看 1.2K关注 0票数 0

我只想提取“山毛榉谷解决方案”

当我跑的时候

代码语言:javascript
复制
html_nodes('li') %>% 
  html_nodes(".flexbox.empLoc") %>%  
  html_text() 

所有的信息都出来了。比奇谷解决方案-亚特兰大,今天24小时

EN

回答 1

Stack Overflow用户

发布于 2019-05-30 08:17:37

还有一种使用rvest进行刮取的方法。不必在html_nodes()中传递css选择器项,您可以在html_nodes().Just中传递xpath,下面的示例如下-

代码语言:javascript
复制
page %>% html_nodes(xpath = "//*[@id='series-matches']/div[20]/div[3]/div[1]/a[1]/span")

参考资料:https://blog.rstudio.com/2014/11/24/rvest-easy-web-scraping-with-r/

X路径更容易获取-

  1. 右键单击要获取xpath的部分。
  2. 从下拉列表中选择检查代码。3. html页面将出现在右侧,从中单击“右键单击并按复制”选项。
  3. 将显示下拉列表,从中选择“复制xpath”。
  4. Ctrl (粘贴)html_nodes中的xpath (xpath= "xpath这里“)。我希望这能帮到你。
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/56368794

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档