首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >无法用rvest刮tripadvisor

无法用rvest刮tripadvisor
EN

Stack Overflow用户
提问于 2022-05-16 10:01:24
回答 1查看 88关注 0票数 0

你好,我可以看到有很多人,你已经成功地使用了下面的代码来抓取tripadvisor,但是它在我的例子中不起作用

代码语言:javascript
复制
library(rvest)
library(xml2)
library(dplyr)
url <- "http://www.tripadvisor.com/ShowUserReviews-g189400-d206779-r838449448-Royal_Olympic-Athens_Attica.html"

reviews <- url %>%
  read_html() %>%
  html_elements("#REVIEWS .innerBubble")

id <- reviews %>%
  html_element(".quote a") %>%
  html_attr("id")

quote <- reviews %>%
  html_element(".quote span") %>%
  html_text()

rating <- reviews %>%
  html_element(".rating .rating_s_fill") %>%
  html_attr("alt") %>%
  gsub(" of 5 stars", "", .) %>%
  as.integer()

date <- reviews %>%
  html_element(".rating .ratingDate") %>%
  html_attr("title") %>%
  strptime("%b %d, %Y") %>%
  as.POSIXct()

review <- reviews %>%
  html_element(".entry .partial_entry") %>%
  html_text()

data.frame(id, quote, rating, date, review, stringsAsFactors = FALSE) %>% View()

你知道为什么不起作用吗?

EN

回答 1

Stack Overflow用户

发布于 2022-05-16 13:30:38

经过多次尝试,对我起作用的是下面这一条。我还没有完成其余的信息。我会随时通知你的。非常感谢@danlooo

代码语言:javascript
复制
reviews3 <- url  %>%
  read_html("home/tripad/file_saved_using_firefox.html") 

reviews4 <- reviews3 %>% 
  html_elements("#REVIEWS .innerBubble")

review <- reviews3 %>%
  html_elements(".entry .partial_entry") %>%
  html_text()

data.frame( review, stringsAsFactors = FALSE) %>% View()```
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/72257424

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档