文章/答案/技术大牛

发布

问fancyimpute测试集的估算
EN

Stack Overflow用户

提问于 2018-11-15 14:57:05

回答 1查看 3.2K关注 0票数 2

Python包范西普特提供了几种方法来估算python中缺少的值。这些文件提供了一些例子，例如：

# X is the complete data matrix
# X_incomplete has the same values as X except a subset have been replace with NaN

# Model each feature with missing values as a function of other features, and
# use that estimate for imputation.
X_filled_ii = IterativeImputer().fit_transform(X_incomplete)

当将计算方法应用于dataset X时，这种方法工作得很好。但是，如果training/test拆分是必要的呢？一次

X_train_filled = IterativeImputer().fit_transform(X_train_incomplete)

如何计算测试集并创建X_test_filled？需要使用来自培训集的信息来估算测试集。我想IterativeImputer()应该返回适合X_test_incomplete的对象。这有可能吗？

请注意，对整个数据集进行估算，然后分割成训练和测试集是不正确的。

missing-data

imputation

fancyimpute

python

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-11-15 15:04:51

这个包看起来就像模仿的坐骑-学习的API。在查看了源代码之后，它看起来确实有一个transform方法。

my_imputer = IterativeImputer()
X_trained_filled = my_imputer.fit_transform(X_train_incomplete)

# now transform test
X_test_filled = my_imputer.transform(X_test)

输入者将应用与它从训练集中学到的相同的计算。

票数 5

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/53322182

复制

相似问题

问fancyimpute测试集的估算
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问fancyimpute测试集的估算EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问fancyimpute测试集的估算
EN