我有一台有很多NAs的DataFrame。pandas的groupby操作忽略其中包含NA的任何组合。有没有办法将NAs包含在组中?如果没有,除了大熊猫groupby,还有什么替代方案?我真的不想填写NAs,因为缺少某些内容是有用的信息。
编辑:我注意到我的问题和groupby columns with NaN (missing) values上报道的问题完全一样,有没有什么技术可以解决这个问题?
发布于 2015-08-07 15:55:11
我将使用某种非NA表示,仅用于groupby的NA,这不能与正确的数据混淆(例如-999999或'missing')
df.fillna(-999999).groupby(...)由于inplace参数的默认值为False,因此您的原始数据帧不会受到影响。
https://stackoverflow.com/questions/31866781
复制相似问题