我需要将几个"tibble“转换为"tsibble”。
下面是一个简单的例子:
require(tidyverse)
require(lubridate)
time_1 <- c(ymd_hms('20210101 000000'),
ymd_hms('20210101 080000'),
ymd_hms('20210101 160000'),
# ymd_hms('20210102 000000'),
ymd_hms('20210102 080000'),
ymd_hms('20210102 160000'))
df_1 <- tibble(time_1, y=rnorm(5))
df_1 %>%
as_tsibble(index=time_1)这段代码按预期工作。但是,如果日期都是午夜,则此代码将抛出一个错误:
time_2 <- c(ymd_hms('20210101 000000'),
ymd_hms('20210102 000000'),
ymd_hms('20210103 000000'),
# ymd_hms('20210104 000000'),
ymd_hms('20210105 000000'),
ymd_hms('20210106 000000'))
df_2 <- tibble(time_2, y=rnorm(5))
df_2 %>%
as_tsibble(index=time_2)我不想以这种方式解决这个问题,因为as.Date函数会更改列类型。
df_2 %>%
mutate(time_2=as.Date(time_2)) %>%
as_tsibble(index=time_2)我也不想以这种方式解决这个问题,因为在将tibble转换为tsibble之后,我需要应用fill_gaps函数,该函数在第二个场景中不会创建ymd_hms('20210104 000000')。
df_2 %>%
as_tsibble(index=time_2, regular=FALSE)这是一个bug吗?
谢谢。
发布于 2021-10-26 22:43:37
这种行为在tsibble的FAQ中得到了解释。
从本质上讲,每天午夜测量的次日数据(ymd_hms())的间隔不一定是1天(24小时)。考虑到有些日子由于您所在时区的夏令时而有变化,因此午夜和第二天午夜之间的小时数可能是23或25小时。
如果您使用的是以每天为间隔测量的数据,则应使用ymd()精度的日期。如果愿意,您可以使用as_datetime()将其转换回日期时间。
就我个人而言,我认为这不应该产生错误,但是如果产生了错误,就会简单得多。也许这里的适当间隔是1小时或30分钟(或者任何适合指定时区中的时区转换的时间间隔)。
https://stackoverflow.com/questions/69726137
复制相似问题