首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >尝试在R Studio中对COVID19疫情数据进行按地区分组和按日期汇总

尝试在R Studio中对COVID19疫情数据进行按地区分组和按日期汇总
EN

Stack Overflow用户
提问于 2020-02-25 00:56:36
回答 1查看 119关注 0票数 0

我是一个尝试学习R的老FOTRAN,C程序员。我开始处理有关COVID19流行的数据,并已搁浅。

我正在处理的数据最初是宽数据,我已经将其转换为行数据。它包含按ProvinceState、区域/国家、纬度、长、日期、案例的每日案例计数。

我想要过滤中国大陆的数据框架,并按日期总结案例作为第一步。当我尝试对数据进行分组时,下面的代码会生成一个空数据集。

谢谢你的帮助!

代码语言:javascript
复制
library(dplyr)
library(dygraphs)
library(lubridate)
library(tidyverse) 
library(timeSeries)

# Set current working directory.
#
     setwd("/Users/markmcleod/MarksRepository/Data")

# Read a  Case csv files
#
     Covid19ConfirmedWideData <- read.csv("Covid19Deaths.csv",header=TRUE,check.names = FALSE)

# count the number of days of data
#
    Covid19ConfirmedDays = NCOL(Covid19ConfirmedWideData)

# Gather Wide Data columns starting at column 5 until NCOL() into RowData DataFrame
#
    Covid19ConfirmedRowData <- gather(Covid19ConfirmedWideData, Date, Cases, 5:Covid19ConfirmedDays, na.rm = FALSE, convert = TRUE)

    tibble(Covid19ConfirmedRowData)

    # # A tibble: 2,204 x 1
    # Covid19ConfirmedRowData$ProvinceState $CountryRegion  $Lat $Long $Date   $Cases
    # <fct>                                 <fct>          <dbl> <dbl> <chr>    <int>
    #   1 Anhui                                 Mainland China  31.8  117. 1/22/20      0
    # 2 Beijing                               Mainland China  40.2  116. 1/22/20      0
    # 3 Chongqing                             Mainland China  30.1  108. 1/22/20      0

# Transmute date from chr to date
#
   Covid19ConfirmedFormatedData <- transmute(Covid19ConfirmedRowData,CountryRegion,Date=as.Date(Date,format="%m/%d/%Y"),Cases) 

   tibble(Covid19ConfirmedFormatedData)

   # # A tibble: 2,204 x 1
   # Covid19ConfirmedFormatedData$CountryRegion $Date      $Cases
   # <fct>                                      <date>      <int>
   #   1 Mainland China                             0020-01-22      0
   # 2 Mainland China                             0020-01-22      0


Covid19ConfirmedGroupedData  <- Covid19ConfirmedFormatedData %>%
  filter(Covid19ConfirmedFormatedData$CountryRegion=='Mainland China')

  tibble(Covid19ConfirmedGroupedData)

  # A tibble: 2,204 x 1
  Covid19ConfirmedGroupedData[,1]  [,2]  [,3]
  <dbl> <dbl> <dbl>
    1                              NA    NA    NA
EN

回答 1

Stack Overflow用户

发布于 2020-02-26 00:24:55

似乎我正在使用的库中有冲突。

我退回到代码的前一个版本,只使用了下面的库。

库(Dygraph)库(Lubridate)库(Tidyverse)

代码似乎又能工作了。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/60380622

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档