我正在处理一个数据集,有一个有趣的列缺少值,但我不想丢弃行(以免丢失其他列的数据)或进行计算(以便不更改数据)。在探索性数据分析期间,我是否可以使用带有缺失值的列的dataframe,并且仅在使用此特定列绘制某项内容时使用不缺少值的幻灯片?
发布于 2021-06-30 07:59:00
我相信您希望与缺少的值一起工作,特别是(X)列,其中列(W,Y,Z)在这些行中有重要的值,不能丢弃或进行计算,特别是为了直观地绘制它们。
是的,考虑到:
发布于 2021-01-24 22:14:16
如果包含缺失值的行数非常小,根据样本大小,我建议将其取消。但是,如果您决定根据不丢失任何信息来保存它们,那么您可以根据涉及空值的特性来做一些事情。
在决定下面的填充方法之前,您应该很好地理解功能列的模式。
如果有任何分类功能,您可以按性别这样的特性进行分组,并且可以做与上面相同的事情。例如,如果一个男性有一个NaN高度值,你可以用男性身高的平均值来填充它。
此外,您还可以决定用以下内容来丢弃整个专栏:
https://datascience.stackexchange.com/questions/88427
复制相似问题