我有一个有34个级别的Race因子。由于许多级别的计数都小于20,我想将它们压缩为一个单独的类别-“其他”。请注意,我已经将"Other"作为一个级别。
我看到了fct_collapse()的文档,因为您指定了想要折叠成一个级别的级别,但不确定如何在其中实现count() < 20。也许是case_when,但我不知道怎么做。
发布于 2020-08-25 06:58:19
您可以使用fct_lump(f=factor, prop=0.05, other_level=“Other”)来折叠表示少于总数的特定百分比的级别。您也可以使用n而不是prop来指定您想要的确切级别数量,例如,9可以获得9个级别+“其他”。
https://stackoverflow.com/questions/63569245
复制相似问题