我有一个关于可变重要性排名的问题。我使用34个变量使用相同的数据集建立了MLP和RF模型,并在类似的测试数据集上获得了相同的精度。正如您在下面的图片中所看到的,SHAP摘要图和RF VIM的顶部变量是非常不同的。有趣的是,我从MLP中删除了低排名变量,提高了精度.然而,射频结果并没有改变。这是否意味着RF不是对此数据集建模的好选择?我仍然感到奇怪的是,排名是如此的不同: SHAP摘要图与RF VIM,我给排名最高的变量和低排名的变量编号。

发布于 2021-06-18 06:21:44
对MLP和RF的排名不应该相同吗?
不是的。不同的标志可能会对某些特征进行更高的排序,但没有理由对其进行相同的排序。
不同的算法:
最重要的是,您所引用的RF“功能重要性”(Gini的平均下降)只是计算RF“特性重要性”的众多方法之一(包括您使用的是哪一种度量,以及如何计算因某一特性而导致的总减少)。相比之下,SHAP在解释特性对结果的贡献方面是不可知的。
总括而言:
,则为“最佳”模型)。
https://stackoverflow.com/questions/67997283
复制相似问题