我是新的,并试图使用R和非常习惯使用excel进行清洁和可视化。我似乎找不到任何地方在如何重命名行变量使用通配符,如excel。如果有可能的话,我想保留Tidyverse中的函数。
我可以查看每个“区域”的数据,但我希望找到两种解决方案之一。
我见过在网络上使用like %,但找不到它可以使用的包。我试图一次用前3个字符或破折号之前的几行重命名变量。我的数据看起来..。
目的地费用
500-1美元
500至2美元
500-3美元
AL-1 \x{e76f} 10
FL-2 x $15
FL-3 $7
我想用短手把这些行重命名..。
500
阿尔
FL
使用Excel,我不需要重命名任何东西并得到我的最终结果,但是我的数据越来越大,比Ii想要的时间还要长。
我的excel公式看起来就像..。
=coutnif(A:A,"500*") =sumif(A:A,"500*")
所以我的最终结果和.
面积计数和
500 -3-180美元
1美元10美元
FL \2\x{e76f} $7
发布于 2022-09-18 04:30:36
我是胡安尼。
很高兴看到新的人从R开始:)
很容易解决你在潮间带里想做的事情。
假设您的数据集在您的环境中被称为"df“,您可以这样做:
library(tidyverse)
df %>%
mutate(Destination = gsub("-.*","", Destination))%>%
group_by(Destination) %>%
summarize(Count = n(), Cost = sum(Cost))如果愿意,您可以在mutate语句的第一部分中将目的地重命名为区域。
此外,您可能希望删除成本列的"$“,并将其转换为数字,以避免某些错误。如果这是您的情况,您可以直接跳到下面的代码:
df %>%
mutate(Destination = gsub("-.*","", Destination),
Cost = as.numeric(gsub("\\$", "", Cost))) %>%
group_by(Destination) %>%
summarize(Count = n(), Cost = sum(Cost))https://stackoverflow.com/questions/73759764
复制相似问题