我想以一种“智能”的方式用python输入丢失的数据。
我已经学习了scikit--通过“平均”和“中值”来计算熊猫,但是我希望通过机器学习、统计算法、分类器来计算,以便根据所有数据的值有独特的值。基本上就像一个分类器学习算法,预测丢失的值(位于我的数据集的任何部分)。
有这样的东西吗?
发布于 2019-02-13 20:22:04
就我所知,这是一个幻想的图书馆,尽管它不太适合学习科学知识。我们计划在scikit中建立更好的估算模型--很快学习,特别是IterativeImputer似乎就是您所要寻找的:https://github.com/scikit-learn/scikit-learn/pull/11977
发布于 2019-02-13 14:19:25
我相信你正在寻找的是所谓的插值。有不同的技术可以做到这一点。
如果您正在使用熊猫DataFrame阅读/处理数据,请尝试:
pandas.DataFrame.interpolatehttps://stackoverflow.com/questions/54672109
复制相似问题