问如何准确地表示用hashingVectorizer生成的列的SHAP值？
EN

Stack Overflow用户

提问于 2022-06-21 10:33:34

回答 1查看 73关注 0票数 1

我使用sklearn中的HashingVectorizer()来表示数据集的唯一ID，该数据集将数据散列为n列，并且我希望计算该数据的总SHAP值。是简单地将所有平均值相加在一起的正确方法，还是取值的平均值？

发布于 2022-06-21 17:03:51

我认为，如果不进行大量的额外工作，您将得到的最接近的是shap.explainers.Partition，它将接受或计算特性的分层聚类。

或者，定义您自己的掩蔽符会更有原则--您应该能够按照描述的这里为每个输入提供它们的列表。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/72699261

复制

相似问题

问如何准确地表示用hashingVectorizer生成的列的SHAP值？EN