文章/答案/技术大牛

发布

社区首页 >问答首页 >对于MLP和RF，变量的排名不应该是一样的吗？

问对于MLP和RF，变量的排名不应该是一样的吗？
EN

Stack Overflow用户

提问于 2021-06-16 06:14:30

回答 1查看 61关注 0票数 2

我有一个关于可变重要性排名的问题。我使用34个变量使用相同的数据集建立了MLP和RF模型，并在类似的测试数据集上获得了相同的精度。正如您在下面的图片中所看到的，SHAP摘要图和RF VIM的顶部变量是非常不同的。有趣的是，我从MLP中删除了低排名变量，提高了精度.然而，射频结果并没有改变。这是否意味着RF不是对此数据集建模的好选择？我仍然感到奇怪的是，排名是如此的不同: SHAP摘要图与RF VIM，我给排名最高的变量和低排名的变量编号。

random-forest

data-modeling

shap

回答 1

Stack Overflow用户

回答已采纳

发布于 2021-06-18 06:21:44

对MLP和RF的排名不应该相同吗？

不是的。不同的标志可能会对某些特征进行更高的排序，但没有理由对其进行相同的排序。

不同的算法：

可以有不同的目标函数来实现预定的目标，
可以使用不同的功能来实现目标函数的min (max)。

最重要的是，您所引用的RF“功能重要性”(Gini的平均下降)只是计算RF“特性重要性”的众多方法之一(包括您使用的是哪一种度量，以及如何计算因某一特性而导致的总减少)。相比之下，SHAP在解释特性对结果的贡献方面是不可知的。

总括而言：

不同的模型对于什么是重要的和不重要的会有不同的看法。对于一个人来说，重要的事情对另一个人来说可能不那么重要，反之亦然。它没有说明模型对特定数据集的适用性。necessary).
Choose
使用SHAP值(或您和您的客户所理解的任何其他特性重要性度量)来解释模型(如果基于您的目标:性能或explainability.

，则为“最佳”模型)。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/67997283

复制

相似问题

问对于MLP和RF，变量的排名不应该是一样的吗？
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问对于MLP和RF，变量的排名不应该是一样的吗？EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问对于MLP和RF，变量的排名不应该是一样的吗？
EN