首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >R时间序列-识别丢失的观测(时间戳)并插入NAs以创建给定长度的时间序列。

R时间序列-识别丢失的观测(时间戳)并插入NAs以创建给定长度的时间序列。
EN

Stack Overflow用户
提问于 2015-02-04 09:04:30
回答 1查看 266关注 0票数 1

我有一套24组分组(分级)的时间序列,时间序列应该超过3年,我想看看每月的销售情况,但结果发现其中一些时间序列缺少观察。

代码语言:javascript
复制
getCounts(Shop1, ...)
2011-01 2011-02 2011-03 2011-04 2011-05 2011-06 2011-07 2011-08 2011-09 2011-10 2011-11 2011-12 2012-02 2012-03 2012-04 2012-05 2012-06 2012-07 2012-08 2012-09 2012-10 2012-11 
 10      22      10      12      36      31      25      19       7       7       7       5       1       9       9      11      10      16      25       3       2       5 

缺少了2012年1月的观测,并于2012年11月结束,尽管它本应持续到2013年12月。

getCounts使用以下命令

代码语言:javascript
复制
with(myDF, tapply(varName, substr(dateName, 1, 7), sum))

每月的计票。

我想用NAs代替时间序列中间和结尾的缺失观测,这样我所有的时间序列都有相同数量的观测值,如果有“洞”,它们就会出现在一个地块上。

有人能帮我吗?

谢谢!

编辑:我喜欢的输出应该如下所示:

代码语言:javascript
复制
      Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
2011   1  NA   2   3   4   5   6  NA   7   8   9  10
2012   2   3   4   5   6  NA  NA  NA  NA  NA  NA  NA

每个NA都在替换一个缺失的观测。

编辑2: getCounts()如下所示:

代码语言:javascript
复制
getCounts <- function(dataObject, dateName, varName){ 
dataNameString <- deparse(substitute(dataObject))   
countsStr <- paste0("with(", dataNameString,", tapply(", varName, ", substr(", dateName, ", 1, 7), sum))")
counts <- eval(parse(text = countsStr))
return(counts)
}

这是dput:

代码语言:javascript
复制
structure(c(10, 22, 10, 12, 36, 31, 25, 19, 7, 7, 7, 5, 1, 9, 
9, 11, 10, 16, 25, 3, 2, 5), .Dim = 22L, .Dimnames = list(c("2011-01", 
"2011-02", "2011-03", "2011-04", "2011-05", "2011-06", "2011-07", 
"2011-08", "2011-09", "2011-10", "2011-11", "2011-12", "2012-02", 
"2012-03", "2012-04", "2012-05", "2012-06", "2012-07", "2012-08", 
"2012-09", "2012-10", "2012-11")))
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2015-02-04 09:48:17

尝尝这个

代码语言:javascript
复制
df <- data.frame(Year = substr(names(x), 1, 4),
                 Month = factor(month.abb[as.numeric(substr(names(x), 6, 7))], 
                         levels = month.abb),
                 Value = x)

library(tidyr)
spread(df, Month, Value)
#   Year Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
# 1 2011  10  22  10  12  36  31  25  19   7   7   7   5
# 2 2012  NA   1   9   9  11  10  16  25   3   2   5  NA

数据

代码语言:javascript
复制
x <- structure(c(10, 22, 10, 12, 36, 31, 25, 19, 7, 7, 7, 5, 1, 9, 
                 9, 11, 10, 16, 25, 3, 2, 5), .Dim = 22L, .Dimnames = list(c("2011-01", 
                 "2011-02", "2011-03", "2011-04", "2011-05", "2011-06", "2011-07", 
                 "2011-08", "2011-09", "2011-10", "2011-11", "2011-12", "2012-02", 
                 "2012-03", "2012-04", "2012-05", "2012-06", "2012-07", "2012-08", 
                 "2012-09", "2012-10", "2012-11")))
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/28317339

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档