dput(日期站点代码D1 D2 D3 D4 D5 D6 D7 D8 D9 H RowTotal 1 2019-07-03 JUP AAGA 0 0 0 1 0 15 16 2 2019-07-03 JUP EFAS 0 0 0 1 1 1 3 2019-07-03 JUP管理0 0 0 1 14 2019-07-03 JUP MCAV 0 0 0 128 5 2019-07-03 JUP MDEC 0 0 0 1 1 6 2019-07-03 JUP MMEA 0 0 0 1 1 7 2019-07-03 JUP OANN 0 0 00 0 0 2 2 8 2019-07-03 JUP PAST 0 0 0 17 17 9 2019-07-03 JUP SBOU 0 0 0 2 2 10 2019-07-03 JUP SINT 0 0 0 9 9 11 2019-07-03 JUP SRAD 00 0 0 1 1 12 2019-07-03 JUP SSID 0 0 0 5 5 13 2019-07-19 SLR ISIN 0 0 0 1 1 14 2019-07-19 SLR MCAV 0 0 0 1 1 2 16 2019-07-19 SLR PCLI 0 0 0 2 5 7 17 2019-07-19 SLR SBOU 0 0 0 1 1 18 2019-07-19 SLR SSID 0 0 0 1 0 8 9 19 2019-07-26 PMP AAGA 0 0 07 7 20 2019-07-26 PMP宏0 0 0 57 57 21 2019-07-26 PMP CNAT 0 0 0 1 1 22 2019-07-26 PMP DSTO 0 0 0 1 1 2 23 2019-07-26 PMP MAUR 0 0 00 0 0 14 14 24 2019-07-26 PMP MCAV 0 0 0 14 285 299)
这是我的数据集。我正在尝试通过添加满足相同Date和Site条件的RowTotals来使用SiteTotal添加一个新列。我在dplyr中尝试了多种方法:group_by、summarize等。我不断遇到替换行数少于dataset的问题。例如,对于这个数据集,使用group_by(Date, Site, RowTotal),我们将替换3行,但有24行。是否有一种方法来填充满足条件的每一行。我的最终目标是找到每个站点在特定日期的“代码”流行率。
我想要的预期列是SiteTotal,如下所示:
(184、184、184、184、184、184、184、184、184、184、184、429、429、429、429、429、81、81、81、81 )
最终目标是将我的RowTotal列除以SiteTotal列,以找到特定日期和站点的“代码流行度”。
发布于 2020-05-30 07:42:12
可以使用mutate添加列
df1 %>% group_by(DATE, SITE) %>% mutate(SiteTotal = sum(RowTotal))
https://stackoverflow.com/questions/62093739
复制相似问题