我正在为我们班做一个小项目。我从一个网站得到了一个数据集:Map/#map
我使用下面的代码成功地导入了数据
disease<- read.csv('Added Source information for vaccine map-3.csv')我的问题是:
我不能添加图片的表,因为我刚刚加入网站,没有足够的声誉,以分享一个形象。
发布于 2014-02-08 17:41:51
也许这可以作为一个开始:
loc <- "https://docs.google.com/spreadsheet/pub?hl=en_US&hl=en_US&key=0AjivqRkNvfzudElKUDJKdlkya29wS2VUTlVFZlBoVVE&single=true&gid=0&output=csv"
dat <- read.csv(
loc,
na.string=c("Sya", "unknown", "NA"),
colClasses=c(
rep("character", 3),
rep("numeric", 2),
"character",
rep("numeric", 2),
rep("character", 3)
)
)
str(dat)这里,colClasses参数显式地定义了每个列的数据类型。如果数据不合适,则会引发错误。na.string选项指定表示在data.frame中获取NA值的“不可用”项的条目。字符编码可能有一些问题,我在这里没有研究过。
要只看到“麻疹”条目,可以使用:
View(subset(dat, Category=="Measles"))对于使用Date列,第一个想法是将start和可选end月份分为两列:
start_date <- function(d) strsplit(d, "-")[[1]][[1]]
start_date <- Vectorize(start_date)
end_date <- function(d) {
spl <- strsplit(d, "-")[[1]]
spl[[length(spl)]]
}
end_date <- Vectorize(end_date)
dat <- transform(dat,
StartDate=start_date(Date),
EndDate=end_date(Date),
stringsAsFactors=FALSE
)现在,您可以筛选在给定月份开始的条目。
str(subset(dat, StartDate=="12/2013"))https://stackoverflow.com/questions/21648053
复制相似问题