我有一个如下的数据集:
date employee products sales
20210101 ben 5 laptop
20210101 ben 10 monitor
20210201 tim 15 laptop
20210301 tim 10 monitor我想要做的是添加另一个字段/列作为这些员工的工作时间。根据员工在特定日期的行数(最多可以是5-10行),工作小时数应该平均分配,但总时间应该始终是每天最多6小时。
所需的输出应为:
date employee products sales hours
20210101 ben 5 laptop 3
20210101 ben 10 monitor 3
20210201 tim 15 laptop 6
20210301 tim 10 monitor 6我没有任何好的想法来执行这个查询。如果有人能给我一个解决这个问题的方法或途径的提示,我将不胜感激。
发布于 2021-11-11 23:20:16
非常确定redshift支持窗口函数..
SELECT *,
6.0/COUNT(*) OVER(PARTITION BY date, employee) as hours
FROM datasethttps://stackoverflow.com/questions/69935915
复制相似问题