首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >对于MLP和RF,变量的排名不应该是一样的吗?

对于MLP和RF,变量的排名不应该是一样的吗?
EN

Stack Overflow用户
提问于 2021-06-16 06:14:30
回答 1查看 61关注 0票数 2

我有一个关于可变重要性排名的问题。我使用34个变量使用相同的数据集建立了MLP和RF模型,并在类似的测试数据集上获得了相同的精度。正如您在下面的图片中所看到的,SHAP摘要图和RF VIM的顶部变量是非常不同的。有趣的是,我从MLP中删除了低排名变量,提高了精度.然而,射频结果并没有改变。这是否意味着RF不是对此数据集建模的好选择?我仍然感到奇怪的是,排名是如此的不同: SHAP摘要图与RF VIM,我给排名最高的变量和低排名的变量编号。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2021-06-18 06:21:44

对MLP和RF的排名不应该相同吗?

不是的。不同的标志可能会对某些特征进行更高的排序,但没有理由对其进行相同的排序。

不同的算法:

  1. 可以有不同的目标函数来实现预定的目标,
  2. 可以使用不同的功能来实现目标函数的min (max)。

最重要的是,您所引用的RF“功能重要性”(Gini的平均下降)只是计算RF“特性重要性”的众多方法之一(包括您使用的是哪一种度量,以及如何计算因某一特性而导致的总减少)。相比之下,SHAP在解释特性对结果的贡献方面是不可知的。

总括而言:

  1. 不同的模型对于什么是重要的和不重要的会有不同的看法。对于一个人来说,重要的事情对另一个人来说可能不那么重要,反之亦然。它没有说明模型对特定数据集的适用性。necessary).
  2. Choose
  3. 使用SHAP值(或您和您的客户所理解的任何其他特性重要性度量)来解释模型(如果基于您的目标:性能或explainability.

,则为“最佳”模型)。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/67997283

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档