我在GitHub (analysis/blob/master/web-scraping/hockey-reference-boxscore-scratch.R)上找到了这个很棒的代码,因为我对R很陌生,对matlab也比较熟悉,我的目标就是使用这些代码来获取我想要的数据。我刚刚从他的github复制了代码,我导入了所有可能的包。在执行RStudio中的代码之后,我得到了以下问题:
table.stats <- readHTMLTable(full.url,header=FALSE)错误:加载外部实体"http://www.hockey-reference.com/boxscores/199511210BOS.html“失败
我试着用这里的其他问答来解决这个问题,但没能解决。我试着用httr包而不是RCurl包重写它,但这是行不通的。
我真的很感激你的帮助。
发布于 2019-09-10 17:38:38
你使用的密码是7年前更新的。而且网站经常改变他们的HTML设计,所以代码不能保证工作。
使用以下代码代替。
library(rvest)
library(httr)
ua <- user_agent("Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.132 Safari/537.36")
url <- 'https://www.hockey-reference.com/boxscores/199511210BOS.html'
session <- html_session(url,ua)
session %>%
html_nodes("table") %>%
html_table()https://stackoverflow.com/questions/57875783
复制相似问题