我已经理解了解释还是预测?论文中的以下段落: Galit。
在解释性建模中,由于统计能力的降低,数据分区是不常见的比预测建模。当使用时,它通常用于评估ˆf的鲁棒性。数据分区在解释性建模中的一种罕见而重要的用途是通过展示一定的预测能力来增强模型的有效性。虽然人们不会期望一个解释模型在预测能力方面是最优的,但它应该显示出一定程度的准确性。
我理解为什么数据分区在预测模型中是有用的,这就是评估模型的泛化能力。然而,在解释模型的情况下,我不明白为什么它应该在预测能力方面显示一定程度的准确性,因为它不是模型的目标。
下面是我的问题:数据分区对于解释性模型是否必要,为什么?
发布于 2018-04-09 10:12:42
解释模型用于识别和解释导致某些特定结果的原因(即识别/量化影响的驱动因素)。
即使该模型不会用于预测,它也需要足够准确地预测响应,以便确保从模型中得出的结论是有效的。作为一个极端的例子,如果您的解释性模型根本无法预测结果,那么您从这个模型中做出的所有推论都是无用的。
那么,如何验证模型的准确性呢?在大多数情况下,在延迟样本上使用数据分区和验证;在您的示例中,验证更多地是为了检查准确性。
https://datascience.stackexchange.com/questions/30071
复制相似问题