给定一系列事件,是否有一种算法可以确定在特定时间段内是否发生了一定数量的事件?例如,给定用户登录列表,是否存在包含超过10个登录的30天周期?
我可以想出一些暴力的方法来做到这一点,只是想知道是否有一个算法或名称来解决这类问题,我没有找到通常的谷歌搜索。
发布于 2013-02-26 18:28:34
一般而言,它被称为入库。它基本上是使用count作为汇总函数在索引(例如time)上聚合一个变量(例如events)。
由于您没有提供数据,因此我将展示一个简单的示例:
# Start with a dataframe of dates and number of events
data <- data.frame(date=paste('2013', rep(1:12, each=20), rep(1:20, times=12), sep='-'),
logins=rpois(12*20, 5))
# Make sure to store dates as class Date, it can be useful for other purposes
data$date <- as.Date(data$date)
# Now bin it. This is just a dirty trick, exactly how you do it depends on what you want.
# Lets just sum the number of events for each month
data$month <- sub('-', '', substr(data$date, 6, 7))
aggregate(logins~month, data=data, sum, na.rm=TRUE)这是你想要的吗?
https://stackoverflow.com/questions/14971344
复制相似问题