首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >用strftime从Po-6 and对象中提取日期和小时

用strftime从Po-6 and对象中提取日期和小时
EN

Stack Overflow用户
提问于 2016-11-19 22:31:40
回答 2查看 1.8K关注 0票数 3

我试图使用strftime从date time列中提取日期和小时,但我不明白为什么返回的值比应该返回的值早1小时。例如,对于2013-01-01 00: 00 :00的日期时间,返回的值应该是2013-01-01 -00,但我得到的是2012-12-31 23。我还试着增加一个小时,然后提取,但在一个很长的日期序列,它再次干扰输出。请参阅此示例代码以供参考。

代码语言:javascript
复制
## creating the sequence of time steps for cleaned
start <- as.POSIXct('2013-01-01 00:00:00',tz='EST')
end <- as.POSIXct('2016-06-06 23:00:00',tz='EST')

timesteps = data.frame( seq.POSIXt(from = start, to =end , by = "5 min"))
colnames(timesteps) = "Time Index"

dateandhour = function (timeindex){
return(strftime(timeindex, format = "%Y-%m-%d %H"))
}

timesteps ['Date and Hour'] = sapply(timesteps$`Time Index`, dateandhour)

请让我知道我在这里错过了什么。非常感谢。

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2016-11-19 22:53:46

这是因为您在as.POSIXct中指定时区,而不是在strptime中指定时区。

代码语言:javascript
复制
timesteps[1,1]
[1] "2013-01-01 EST"

 strftime(timesteps[1,1], format = "%Y-%m-%d %H")
[1] "2012-12-31 21"
 strftime(timesteps[1,1], format = "%Y-%m-%d %H",tz='EST')
[1] "2013-01-01 00"`

dateandhour = function (timeindex){
  return(strftime(timeindex, format = "%Y-%m-%d %H",tz='EST'))
}

timesteps ['Date and Hour'] = sapply(timesteps$`Time Index`, dateandhour)

head(timesteps)
           Time Index Date and Hour
1 2013-01-01 00:00:00 2013-01-01 00
2 2013-01-01 00:05:00 2013-01-01 00
3 2013-01-01 00:10:00 2013-01-01 00
4 2013-01-01 00:15:00 2013-01-01 00
5 2013-01-01 00:20:00 2013-01-01 00
6 2013-01-01 00:25:00 2013-01-01 00
票数 2
EN

Stack Overflow用户

发布于 2016-11-19 23:01:23

以下是两行回答:

创建序列

代码语言:javascript
复制
df <- data.frame(TimeIndex = 
         seq(anytime("2013-01-01 00:00:00"), 
             anytime("2016-06-06 23:00:00"), by="5 min"))

这就产生了361 k观测结果:

代码语言:javascript
复制
R> dim(df)
[1] 360841      1
R> 

转换为日期和时间

当R被矢量化时,您可以在一次操作中做到这一点:

代码语言:javascript
复制
df$DateAndHour <- strftime(df$TimeIndex, "%Y-%m-%d %H")

我们可以查一查:

代码语言:javascript
复制
R> head(df, 10)
             TimeIndex   DateAndHour
1  2013-01-01 00:00:00 2013-01-01 00
2  2013-01-01 00:05:00 2013-01-01 00
3  2013-01-01 00:10:00 2013-01-01 00
4  2013-01-01 00:15:00 2013-01-01 00
5  2013-01-01 00:20:00 2013-01-01 00
6  2013-01-01 00:25:00 2013-01-01 00
7  2013-01-01 00:30:00 2013-01-01 00
8  2013-01-01 00:35:00 2013-01-01 00
9  2013-01-01 00:40:00 2013-01-01 00
10 2013-01-01 00:45:00 2013-01-01 00
R> 

我使用上面的任何时间,因为我发现它简洁方便--不需要格式。我们也可以使用as.POSIXct()strptime()

我还省略了tz参数,以便所有东西都在我的本地时区。您可以在每次调用anytime()strftime()时设置它,也可以设置TZ环境变量。

编辑:正如OP所问到的关于性能的问题,下面是一个简单的比较。我需要稍微修改一下解:

代码语言:javascript
复制
df <- data.frame(TimeIndex = seq(anytime("2013-01-01 00:00:00"),
                                 anytime("2016-06-06 23:00:00"), by="5 min"))

dateandhour <- function (timeindex) {
    return(strftime(timeindex, format = "%Y-%m-%d %H"))
}

f1 <- function(df) { data.frame(TimeIndex=df, DateAndHour=sapply(df, dateandhour)) }
f2 <- function(df) { data.frame(TimeIndex=df, DateAndHour=strftime(df$TimeIndex, "%Y-%m-%d %H")) }

library(rbenchmark)

benchmark(f1(df), f2(df), replications=10)[,1:4]

这样我就明白了:

代码语言:javascript
复制
R> benchmark(f1(df), f2(df), replications=10)[,1:4]
    test replications elapsed relative
1 f1(df)           10   7.101     2.08
2 f2(df)           10   3.414     1.00
R> 

两倍的进步。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/40698641

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档