我想为多个样本的时间序列计算曲线下的面积。数据类型POSIXlt的时间变量
我的数据是这样设置的
day = c(rep(1, 4), rep(2,4))
time = c("2016-11-10 11:40:42",
"2016-11-10 11:45:42",
"2016-11-10 11:50:42",
"2016-11-10 11:55:42",
"2016-11-11 11:40:42",
"2016-11-11 11:45:42",
"2016-11-11 11:50:42",
"2016-11-11 11:55:42")
time = as.POSIXlt(time)
value = runif(8, min=4, max=20)
combined = data.frame(day, time, value)
day time value
1 1 2016-11-10 11:40:42 10.726758
2 1 2016-11-10 11:45:42 14.123989
3 1 2016-11-10 11:50:42 12.145620
4 1 2016-11-10 11:55:42 7.254183
5 2 2016-11-11 11:40:42 8.385879
6 2 2016-11-11 11:45:42 16.411480
7 2 2016-11-11 11:50:42 4.640858
8 2 2016-11-11 11:55:42 17.300498我想计算的AUC每一天的系列。我有一个很大的数据集与五月份的数据。时间已经按顺序排列(这是五月份的连续测量)。
理想情况下,我希望输出如下:
day AUC
1 x
2 x
etc.... 任何帮助都很感激。
发布于 2016-11-12 00:14:43
你有预测和结果吗?我生成了一个假设您缺少这些列的示例。
# install.packages("ModelMetrics")
library(ModelMetrics)
library(dplyr)
day = c(rep(1, 4), rep(2,4),)
time = c("2016-11-10 11:40:42",
"2016-11-10 11:45:42",
"2016-11-10 11:50:42",
"2016-11-10 11:55:42",
"2016-11-11 11:40:42",
"2016-11-11 11:45:42",
"2016-11-11 11:50:42",
"2016-11-11 11:55:42")
time = as.POSIXlt(time)
outcome = as.numeric(runif(8, min=0, max=1) > .5)
predictions = runif(8, min=0, max=1)
combined = data.frame(day, time, outcome, predictions)
combined %>%
group_by(day) %>%
summarise(
Predictions = n()
,AUCs = auc(outcome, predictions)
)发布于 2016-11-11 20:56:13
我不知道你是想计算一天的平均数,还是计算一天的总和.但您可以将此代码更改为您自己的需要:
df$day <- as.Date(df$day)
df %>%
group_by(day) %>%
summarise(AUC = mean(value))https://stackoverflow.com/questions/40555916
复制相似问题