首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >足球统计Python Scraper

足球统计Python Scraper
EN

Stack Overflow用户
提问于 2012-12-06 06:02:44
回答 1查看 1.2K关注 0票数 1

我希望将一些Houston Dynamo stats from this season收集到CSV中,然后使用R可视化该数据。

如何使用lxml同时抓取tr和td元素?有没有我应该看的更简单的选择器?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2012-12-06 06:16:30

对于(合理地)格式良好的HTML表,R中的XML包使得这类事情变得非常简单:

代码语言:javascript
复制
library(XML)
> url <- "http://www.houstondynamo.com/stats/season?page=0"
> tbl <- readHTMLTable(url)
> head(tbl[[1]])
           Player POS GP GS MINS  G  A SHTS SOG GWG PKG/A HmG RdG G/90min  SC%
1      Will Bruin   F 32 31 2510 12  4   78  35   0   0/0   6   6    0.43 15.4
2      Brad Davis   M 31 28 2523  8 12   53  22   3   3/4   5   3    0.29 15.1
3     Brian Ching   F 30 13 1385  5  5   35  15   1   2/2   2   3    0.32 14.3
4   Boniek Garcia   M 17 17 1530  4  6   30  12   1   0/0   3   1    0.24 13.3
5      Calen Carr   M 26 17 1512  4  2   29  11   2   0/0   3   1    0.24 13.8
6 Macoumba Kandji   F 29 21 1630  4  2   34  16   1   0/0   3   1    0.22 11.8
票数 5
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/13733276

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档