我想使用MLR以通用的方式处理更大的数据集,特别是使用impute和reimpute函数。由于它必须填充的数据和数据集的大小,我想知道一些细节,假设需要多长时间。
有谁知道这样一个解决方案的方法吗?
所以基本上我希望‘mlr:impute()’有一个‘Verbose=TRUE’函数,这个函数是不存在的。
致以敬意,
发布于 2019-02-05 01:20:10
不幸的是,目前还不支持这一点,也没有计划添加它。原因是很难预测这样的操作需要多长时间--事实上,这本身就是一个机器学习问题。mlr用于补偿和其他目的的大多数技术都是由第三方库提供的,因此不能轻松地提取进度信息。
即使我们可以合理准确地预测操作所需的时间,这样做的开销也会使短操作变得慢得多,并且需要更多的内存。即使在这种情况下,结果也会因机器不同而不同(是否会耗尽内存?),从而使可靠的部署变得更加复杂。
https://stackoverflow.com/questions/54516411
复制相似问题