我正在处理195个国家1980-2020年期间通货膨胀率的数据集(csv file)。我想制作一张图表,描述1980-2020年间通胀率的分布情况。在此期间,我制作了以下图表:

我对图表的问题是,我想描述一个截断的数据集:膨胀率在99.5%的百分位数内,异常值从数据集中消除。任何洞察力都是非常感谢的。
发布于 2021-08-23 23:22:40
您可以使用quantile-function:
library(dplyr)
data %>%
group_by(year) %>%
filter(value <= quantile(value, 0.995))删除每年计算的每个大于99.5%百分位数的值。如果不想按年计算,请删除group_by()-line。
https://stackoverflow.com/questions/68899623
复制相似问题