我在Python中使用SHAP xAI来解释整个测试数据。

。
我想知道每一行的点是怎么散落的?更密集的点区域意味着什么?为什么每一行的零散区域之间都有空隙?
发布于 2022-05-24 03:15:30
Y轴是特征名。散点图上的每一行表示一个特征。
X轴是SHAP值。每一行都有相同数量的点:即数据集中的数据点数。在线上的每一个点都描述了这个特定点产生的SHAP值。值的聚类意味着这些特征值倾向于产生相似的SHAP值(由于输出的不敏感性或特征值本身的低分散度)。
点的着色是原始单位中的特征值。
因此,把所有这些放在一起,下面一行就可以声明:
低特征值倾向于产生低SHAP(ley)值(蓝色数据点具有负SHAP values)
注意,每当我说“不敏感”时,我的意思是“平均边际贡献比所有可能的联盟都低”。
https://stackoverflow.com/questions/72353160
复制相似问题