首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >计算df.groupby python中nas的数量

计算df.groupby python中nas的数量
EN

Stack Overflow用户
提问于 2022-04-29 14:43:49
回答 1查看 43关注 0票数 0

我正在使用python中包含大量NAs的数据框架。我想数一下每个变量的NAs数。我查看了文档并找到了count(),除了它,它给了我与我想要的相反的东西:

代码语言:javascript
复制
df.groupby("var1").count()

我的问题是,我怎么能只计算群中的NAs数量呢?我试过:

代码语言:javascript
复制
df.groupby("var1").isnull() or df.groupby("var1").isna() 

代码语言:javascript
复制
df.groupby("var1").apply(isnull)

但这会给我带来错误。

我想做的是:将数据库按变量分组(在本例中为公民权),然后计算每个因素的每个级别的NAs数。

我希望输出类似于屏幕截图,但输出的是NAs数,而不是观察数减去NAs数:

屏幕截图

或者,换句话说,我正在寻找Python中这个R代码的解决方案:

代码语言:javascript
复制
dat%>%group_by(citizenship)%>%summarise_all(funs(sum(is.na(.)))
EN

回答 1

Stack Overflow用户

发布于 2022-04-29 17:36:38

如果“每个变量”指的是每个dataframe列,则可以这样做:

代码语言:javascript
复制
df['column name'].isna().sum()

如果您想使用groupby,您可以在这里找到一个解决方案:熊猫在群函数中计数空值

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/72059696

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档