我在这里跟随了一些问题,这些问题是关于如何将字符向量转换为日期时间类的。我经常看到两个方法,strptime和as.POSIXct/as.POSIXlt方法。我看了这两个函数,但不清楚有什么不同。
strptime
function (x, format, tz = "")
{
y <- .Internal(strptime(as.character(x), format, tz))
names(y$year) <- names(x)
y
}
<bytecode: 0x045fcea8>
<environment: namespace:base>as.POSIXct
function (x, tz = "", ...)
UseMethod("as.POSIXct")
<bytecode: 0x069efeb8>
<environment: namespace:base>as.POSIXlt
function (x, tz = "", ...)
UseMethod("as.POSIXlt")
<bytecode: 0x03ac029c>
<environment: namespace:base>执行微基准测试以查看是否存在性能差异:
library(microbenchmark)
Dates <- sample(c(dates = format(seq(ISOdate(2010,1,1), by='day', length=365), format='%d-%m-%Y')), 5000, replace = TRUE)
df <- microbenchmark(strptime(Dates, "%d-%m-%Y"), as.POSIXlt(Dates, format = "%d-%m-%Y"), times = 1000)
Unit: milliseconds
expr min lq median uq max
1 as.POSIXlt(Dates, format = "%d-%m-%Y") 32.38596 33.81324 34.78487 35.52183 61.80171
2 strptime(Dates, "%d-%m-%Y") 31.73224 33.22964 34.20407 34.88167 52.12422strptime看起来稍微快一点。那是怎么回事呢?为什么会有两个相似的函数,或者它们之间有我遗漏的差异?
发布于 2012-05-22 18:14:26
好吧,这些函数做不同的事情。
首先,有两个日期/时间的内部实现:POSIXct和POSIXlt,前者存储自UNIX纪元以来的秒数(+其他一些数据),后者存储日、月、年、小时、分钟、秒等列表。
strptime是一个将字符向量(各种格式)直接转换为POSIXlt格式的函数。
as.POSIXlt可以将各种数据类型转换为POSIXlt。它试图变得智能并做一些明智的事情--在角色的情况下,它充当strptime的包装器。
as.POSIXct可以将各种数据类型转换为POSIXct。它还试图变得智能并做一些明智的事情--对于字符,它首先运行strptime,然后执行从POSIXlt到POSIXct的转换。
strptime更快是有道理的,因为strptime只处理字符输入,而其他的则试图从输入类型中确定使用哪种方法。它也应该更安全一些,因为提供意外的数据只会给出一个错误,而不是试图做可能不是你想要的智能的事情。
发布于 2016-10-28 00:00:38
有两种POSIXt类型: POSIXct和POSIXlt。"ct“可以代表日历时间,它存储了从原点开始的秒数。"lt“或本地时间将日期保存为时间属性列表(如”小时“和”星期一“)。请尝试以下示例:
date.hour=strptime("2011-03-27 01:30:00", "%Y-%m-%d %H:%M:%S")
date=c("26/10/2016")
time=c("19:51:30")
day<-paste(date,"T", time)
day.time1=as.POSIXct(day,format="%d/%m/%Y T %H:%M:%S",tz="Europe/Paris")
day.time1
day.time1$year
day.time2=as.POSIXlt(day,format="%d/%m/%Y T %H:%M:%S",tz="Europe/Paris")
day.time2
day.time2$yearhttps://stackoverflow.com/questions/10699511
复制相似问题