问h2o.ai标度标定
EN

Stack Overflow用户

提问于 2017-09-12 08:59:45

回答 1查看 993关注 0票数 6

我注意到在h2o.ai套件中增加了一个相对较重的部分，即执行辅助Platt以改进输出概率校准的能力。(见在h2o手册中.)然而，在在线帮助文档上，很少有指导是可以获得的。我特别想知道，何时启用Platt缩放：

它对模特的领导板有什么影响？也就是说，普拉特标度是在排名度量之后还是在此之前计算的？
它如何影响计算性能？
calibration_frame是否可以与validation_frame相同，或者不应该(在计算或理论观点下)？

提前感谢

h2o

calibration

回答 1

Stack Overflow用户

回答已采纳

发布于 2017-09-21 18:39:25

校准是在模型完成后运行的后处理步骤.因此，它不影响主板，对训练指标也没有影响。它增加了2列的得分框架(与校准的预测)。

这篇文章提供了如何构造校准框架的指导：

将数据集拆分为测试和训练
将列车组划分为模型训练和校准。

它还说:最重要的一步是创建一个单独的数据集来执行校准。

我认为校准框架应该只用于校准，因此与验证框架不同。保守的答案是，它们应该是分开的--当您使用验证框架进行早期停止或任何内部模型优化(例如，H2O GLM中的lambda搜索)时，验证框架将成为“培训数据”的扩展，因此在这一点上是不允许的。但是，您可以尝试这两个版本并直接观察其效果，然后作出决定。以下是本文中的一些其他指导：

“用于校准的数据数量将取决于你拥有的数据量。校准模型一般只会拟合少量的参数(所以你不需要大量数据)。我的目标是大约10%的培训数据，但至少要有50个例子。”

票数 5

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/46172137

复制

相似问题

问h2o.ai标度标定
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问h2o.ai标度标定EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问h2o.ai标度标定
EN