首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何在从网站中抓取表后为列添加值

如何在从网站中抓取表后为列添加值
EN

Stack Overflow用户
提问于 2014-11-10 08:57:34
回答 1查看 101关注 0票数 1

我正试图从埃博拉疫情清单中得到埃博拉的总死亡人数,但似乎找不到我的错误。会很感激你的帮助。网站链接为outbreaks

我使用了以下代码:

代码语言:javascript
复制
url1 <-'http://en.wikipedia.org/wiki/List_of_Ebola_outbreaks'
df1<- readHTMLTable(url1)[[2]]
df1$"Human death"

但是当我试图用sum函数来添加这个值的时候。它给出了以下错误

代码语言:javascript
复制
Error in Summary.factor(c(5L, 12L, 1L, 2L, 9L, 1L, 1L, 1L, 1L, 14L, 1L,  : 
  sum not meaningful for factors

有人能帮我弄清楚吗?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2014-11-10 09:05:40

您正在读取带有R默认值的表,该表将字符转换为因素。您可以在stringsAsFactors = FALSE中使用readHTMLTable,这将传递给data.frame。此外,该表还使用逗号来分隔千个分隔符,您需要删除这些分隔符:

代码语言:javascript
复制
library(XML)
url1 <-'http://en.wikipedia.org/wiki/List_of_Ebola_outbreaks'
df1<- readHTMLTable(url1, which = 2, stringsAsFactors = FALSE)
df1$"Human death"
sum(as.integer(gsub(",", "", df1$"Human death")))

> mySum
[1] 6910
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/26839983

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档