首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何找到missing_mask?

如何找到missing_mask?
EN

Stack Overflow用户
提问于 2019-03-14 01:02:32
回答 1查看 216关注 0票数 0

我试着跟着https://pypi.org/project/fancyimpute/

代码语言:javascript
复制
# print mean squared error for the four imputation methods above
ii_mse = ((X_filled_ii[missing_mask] - X[missing_mask]) ** 2).mean()
print("Iterative Imputer norm minimization MSE: %f" % ii_mse)

nnm_mse = ((X_filled_nnm[missing_mask] - X[missing_mask]) ** 2).mean()
print("Nuclear norm minimization MSE: %f" % nnm_mse)

softImpute_mse = ((X_filled_softimpute[missing_mask] - X[missing_mask]) ** 2).mean()
print("SoftImpute MSE: %f" % softImpute_mse)

knn_mse = ((X_filled_knn[missing_mask] - X[missing_mask]) ** 2).mean()
print("knnImpute MSE: %f" % knn_mse)

什么是missing_mask ?我如何从缺少值的数据帧中获取它?

EN

回答 1

Stack Overflow用户

发布于 2019-03-14 02:29:20

缺失掩码是一个布尔数组或一组索引,其中您的数据缺失。例如,假设您有一个数组,其中包含一些缺失值,如下所示。

1 2

丢失的掩码将是另一个布尔值数组,其中条目在数据丢失的位置为True。在这种情况下,它将是:

错误错误

请查看此页面以获取pandas中的相关函数。https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.mask.html

如果要在原始数据集上创建缺少的蒙版,可以使用df.isna()或df.isnull()。

不过,在您的情况下,此过程并不相关。您已经有了缺失值的数据集。只需对此数据集运行估算即可。FancyImpute手册中缺少的掩码仅在您想要计算性能指标或人工创建具有缺失值的数据集,然后对其执行补偿时才会使用。

希望这对你有帮助,祝你好运!

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/55147496

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档