首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在pandas数据帧中查找特定的值组合

在pandas数据帧中查找特定的值组合
EN

Stack Overflow用户
提问于 2021-04-09 18:07:21
回答 1查看 33关注 0票数 0

我正在为机器学习准备一个数据帧。该数据集包含澳大利亚几个气象站10年来的天气数据。测量的属性之一是蒸发量。它有大约50%的缺失值。现在我想找出,缺失值是均匀分布在所有气象站,还是大约一半的气象站从未测量过蒸发量。

如何找出一个值与另一个属性组合的分布情况?我基本上想在气象站上循环,并获得NaNs和正常值的计数。

代码语言:javascript
复制
rain_df.query('Location == "Albury"').Location.count()

这给了我来自奥尔伯里weaher站的测量点的数量。现在,我如何才能找出在奥尔伯里与正常(非NaN)测量相比,有多少NaN被测量?

EN

回答 1

Stack Overflow用户

发布于 2021-04-09 19:04:08

您可以使用.isnull()对一个系列进行掩码,对NaNs使用True,对其他所有内容使用False。然后,您可以使用.value_counts(normalize=True)来获取该系列中NaN和非NaN的比例。

代码语言:javascript
复制
rain_df.query('Location == "Albury"').Location.isnull().value_counts(normalize=True)
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/67019115

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档