我无意中发现了这个博客,它展示了一个经过训练以适应经过适当训练的随机森林模型的预测的决策树是如何以与原始随机森林差不多的方式进行推广的。
我对此很感兴趣,因为我是在嵌入式环境中实现ML的,在这种情况下,一个1000个例子射频是不可行的,但是一个更简单的10s分支树可能是可行的。
我的第一个问题是:这是不是太好了?我能看到的唯一缺点是,由于过度拟合的过程,生成的决策树将非常大,但在任何情况下,我都假设它比整个随机森林更简单。
次要问题:文献中是否有更详细地讨论这一过程的东西?
发布于 2023-05-24 04:40:54
不,此决策树无法“以与原始随机林相同的方式进行泛化”。
作者还在一节中清楚地说明了这一点,这种近似是否适用于看不见的数据?唯一的问题是,这一策略严格地只适用于已见/可用的数据‘。至少不能保证。
这种方法的主要用途是它的可解释性--使用一个简单、易于解释的模型来模拟一个更复杂的模型的行为,从而了解复杂模型是如何做出决策的。然而,这种可解释性一般不适用于看不见的数据。
https://datascience.stackexchange.com/questions/121686
复制相似问题