在帕特里克·施拉茨的帖子中,交叉验证-训练/预测“误解”
https://mlr-org.com/docs/cv-vs-predict/
提到:
(a)进行CV是为了获得模型性能的估计。
(b)训练/预测是为了创建最终预测(你的老板可能会用它来做出一些决策)。
这意味着在mlr3中,如果我们在学术界,需要发表论文,我们需要使用CV,因为我们打算比较不同算法的性能。在行业中,如果我们的计划是训练一个模型,然后不得不一次又一次地使用行业数据进行预测,我们需要使用mlr3提供的训练/预测方法吗?
是不是我完全选错了什么?
谢谢
发布于 2021-02-07 05:07:02
如果你想对一个模型的表现做一个陈述,你总是需要一份简历。
如果要使用模型对未知数据进行预测,请进行一次拟合,然后进行预测。
所以在实践中,你需要两个: CV + "train+predict“。
PS:你的帖子并不适合Stackoverflow,因为它与编码问题无关。有关统计问题,请参阅https://stats.stackexchange.com/。
PS2:如果你谈论的是一篇文章,请附上链接。在这种情况下,我是这篇文章的作者,但大多数人可能不知道你在说什么;)
https://stackoverflow.com/questions/66078575
复制相似问题