首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何制作包含滚动存储桶集合中数据计数的集合

如何制作包含滚动存储桶集合中数据计数的集合
EN

Stack Overflow用户
提问于 2012-05-25 00:04:34
回答 2查看 814关注 0票数 3

我有相当于一个月流量的服务器日志。下面的部分示例

代码语言:javascript
复制
"UploadDateGMT","UserFileSize","TotalBusinessUnits"
"2012-01-01 00:00:38","1223","1"
"2012-01-01 00:01:16","1302","1"
"2012-01-01 00:08:10","1302","1"

我想把它转换成一个数据集,在这个数据集上,我可以滚动计算每个五分钟窗口中有多少字节的提交。(即0-5、1-6、2-7等)从这里,我可以提取最大负载,95%的负载,制作漂亮的负载图形,等等。

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2012-05-25 00:53:49

扩展@PLapointe的answer

代码语言:javascript
复制
endp <- endpoints(tab2, on="mins", k=1) # 1 minute endpoints
onemin <- period.apply(tab2,endp,sum)   # sum per 1-minute period
onemin <- align.time(onemin)            # align to end-of-period times
# all one-minute increments from start--end of onemin
allonemin <- seq(start(onemin), end(onemin), by="1 min")
onemin <- merge(onemin, xts(,allonemin))
fivemin <-  rollapplyr(onemin, 5, sum, na.rm=TRUE, fill=NA)
票数 4
EN

Stack Overflow用户

发布于 2012-05-25 00:27:57

xts包可以做到这一点:

代码语言:javascript
复制
library(xts)
tab <-read.table(text="UploadDateGMT,UserFileSize,TotalBusinessUnits
'2012-01-01 00:00:38',1223,1
'2012-01-01 00:01:16',1302,1
'2012-01-01 00:08:10',1302,1", header=TRUE, as.is=TRUE,sep = ",")

tab2<-xts(tab$UserFileSize,order.by=as.POSIXct(tab$UploadDateGMT) ) #create xts object
endp <-endpoints(tab2, on="mins", k=5) #5 minutes endpoints
fivemin <-period.apply(tab2,endp,sum) #sum per 5-minute period
fivemin

                    [,1]
2012-01-01 00:01:16 2525
2012-01-01 00:08:10 1302

如果希望时间列以5分钟为增量:

代码语言:javascript
复制
res<- align.time( fivemin[endpoints(fivemin, on="mins", k=5)], n=60*5)
票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/10741180

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档