我在R中使用以下数据。
DF<-
ID Date Notes Value
PR-1 2020-01-25 15:13:17 avbc sdr df/ert 123 1500.00
PR-1 2020-01-25 15:13:17 avbc sdr df/ert 123 25000.00
PR-1 2020-01-25 15:13:17 Successful Trn to A/c 10000.00
PR-1 2020-01-25 15:13:17 Successful Trn to A/c 15000.00
PR-1 2020-01-25 15:13:17 avbc sdr df/ert 123 5000.00
PR-2 2020-01-20 22:33:45 xyzs sdr df/ert 123 [null]
PR-2 2020-01-20 22:33:45 avbc ert df/ert 123 0.00
PR-2 2020-01-20 22:33:45 Successful Trn to A/c 15000.00
PR-2 2020-01-20 22:33:45 Successful Trn to A/c 25000.00
PR-2 2020-01-20 22:33:45 Successful Trn to A/c 15000.00
PR-2 2020-01-20 22:33:45 aerc sxr df/ert 123
PR-3 2020-01-12 19:12:34 aerc sxr df/ert 123 1400.00 我想把'Notes‘包含字符串的值和起来,比如Successful Trn to A/c。
请求输出:
ID Date Sum_Value Status
PR-1 2020-01-25 15:13:17 25000.00 False
PR-2 2020-01-20 22:33:45 55000.00 True
PR-3 2020-01-12 19:12:34 0 No String如果Sum_Value是>=50000而不是True或False,如果Successful Trn to A/c的no条目可用,则为No String。
发布于 2020-04-26 16:18:18
您可以使用dplyr:
library(dplyr)
DF %>% filter(str_detect(Notes, "Successful")) %>% group_by(ID, Date) %>%
summarise(Sum_value = sum(Value))PS:请下一次用dput(data)把数据发出来。
https://stackoverflow.com/questions/61443905
复制相似问题