考虑到我有以下数据表:
total_sales tickets_sold show_time occu_perc ticket_price DATE
1: 3900000 26 4 4.26 150000 2018-05-05
2: 3360000 42 5 8.08 80000 2018-05-05
3: 2560000 32 4 20.00 80000 2018-05-05
4: 1200000 12 1 11.01 100000 2018-05-05
5: 1200000 15 3 16.67 80000 2018-05-05
6: 1050000 7 3 0.98 150000 2018-05-05数据包括日销售量、售票量等。我打算将除日期变量外的所有数据转换为一个时间序列进行多变量分析。但是,我想将条目转换为每月平均显示时间。我该怎么做?
发布于 2021-12-29 01:30:29
您可以从DATE中提取年份和月份值,并聚合每个月的变量并返回mean。
library(dplyr)
df %>%
mutate(DATE = as.Date(DATE),
ym = format(DATE, '%Y-%m')) %>%
group_by(ym) %>%
summarise(across(total_sales:ticket_price, mean, na.rm = TRUE))https://stackoverflow.com/questions/70514034
复制相似问题