我是R的新手,在网络编程方面没有经验。现在,我被分配了一个项目,负责整理和可视化航空安全数据。我在网上搜索了数据并在这里获得了网站http://aviation-safety.net/database/我对飞机型号、年份、国家和航空公司子类别感兴趣,我如何使用rvest将这些数据作为数据帧获取下来?
这就像是一个免费搭便车的问题,但抓取只是超出了我的知识。
发布于 2018-03-05 08:31:57
实际上,rvest让这一切变得非常简单。例如,链接到1919年的数据,然后
library(rvest)
read_html("http://aviation-safety.net/database/dblist.php?Year=1919") %>%
html_table()
[[1]]
date type registration operator fat. location pic cat
1 02-AUG-1919 Caproni Ca.48 Caproni 14 Verona NA NA A1
2 11-AUG-1919 Felixstowe Fury N123 RAF 1 near Felixtowe RNAS NA NA A1链接应该是直截了当的,甚至不需要刮掉它们,对吧?要从图片中获取国家,您必须选择旗帜图像标题
read_html("http://aviation-safety.net/database/dblist.php?Year=1919") %>%
html_nodes(".innertube > table") %>%
html_nodes(".list > img") %>% html_attr("title") %>% na.omit()
[1] "Italy" "U.K."
attr(,"na.action")https://stackoverflow.com/questions/49101762
复制相似问题