我试着跟着https://pypi.org/project/fancyimpute/
# print mean squared error for the four imputation methods above
ii_mse = ((X_filled_ii[missing_mask] - X[missing_mask]) ** 2).mean()
print("Iterative Imputer norm minimization MSE: %f" % ii_mse)
nnm_mse = ((X_filled_nnm[missing_mask] - X[missing_mask]) ** 2).mean()
print("Nuclear norm minimization MSE: %f" % nnm_mse)
softImpute_mse = ((X_filled_softimpute[missing_mask] - X[missing_mask]) ** 2).mean()
print("SoftImpute MSE: %f" % softImpute_mse)
knn_mse = ((X_filled_knn[missing_mask] - X[missing_mask]) ** 2).mean()
print("knnImpute MSE: %f" % knn_mse)什么是missing_mask ?我如何从缺少值的数据帧中获取它?
发布于 2019-03-14 02:29:20
缺失掩码是一个布尔数组或一组索引,其中您的数据缺失。例如,假设您有一个数组,其中包含一些缺失值,如下所示。
1 2
丢失的掩码将是另一个布尔值数组,其中条目在数据丢失的位置为True。在这种情况下,它将是:
错误错误
请查看此页面以获取pandas中的相关函数。https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.mask.html
如果要在原始数据集上创建缺少的蒙版,可以使用df.isna()或df.isnull()。
不过,在您的情况下,此过程并不相关。您已经有了缺失值的数据集。只需对此数据集运行估算即可。FancyImpute手册中缺少的掩码仅在您想要计算性能指标或人工创建具有缺失值的数据集,然后对其执行补偿时才会使用。
希望这对你有帮助,祝你好运!
https://stackoverflow.com/questions/55147496
复制相似问题