首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用rvest包抓取航空安全数据

使用rvest包抓取航空安全数据
EN

Stack Overflow用户
提问于 2018-03-05 07:54:11
回答 1查看 84关注 0票数 0

我是R的新手,在网络编程方面没有经验。现在,我被分配了一个项目,负责整理和可视化航空安全数据。我在网上搜索了数据并在这里获得了网站http://aviation-safety.net/database/我对飞机型号、年份、国家和航空公司子类别感兴趣,我如何使用rvest将这些数据作为数据帧获取下来?

这就像是一个免费搭便车的问题,但抓取只是超出了我的知识。

EN

回答 1

Stack Overflow用户

发布于 2018-03-05 08:31:57

实际上,rvest让这一切变得非常简单。例如,链接到1919年的数据,然后

代码语言:javascript
复制
library(rvest)

read_html("http://aviation-safety.net/database/dblist.php?Year=1919") %>%
  html_table()

[[1]]
         date            type registration operator fat.            location    pic cat
1 02-AUG-1919   Caproni Ca.48               Caproni   14              Verona NA  NA  A1
2 11-AUG-1919 Felixstowe Fury         N123      RAF    1 near Felixtowe RNAS NA  NA  A1

链接应该是直截了当的,甚至不需要刮掉它们,对吧?要从图片中获取国家,您必须选择旗帜图像标题

代码语言:javascript
复制
read_html("http://aviation-safety.net/database/dblist.php?Year=1919") %>%
  html_nodes(".innertube > table") %>%
  html_nodes(".list > img") %>% html_attr("title") %>% na.omit()

[1] "Italy" "U.K." 
attr(,"na.action")
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/49101762

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档