我使用sklearn中的HashingVectorizer()来表示数据集的唯一ID,该数据集将数据散列为n列,并且我希望计算该数据的总SHAP值。是简单地将所有平均值相加在一起的正确方法,还是取值的平均值?
发布于 2022-06-21 17:03:51
我认为,如果不进行大量的额外工作,您将得到的最接近的是shap.explainers.Partition,它将接受或计算特性的分层聚类。
或者,定义您自己的掩蔽符会更有原则--您应该能够按照描述的这里为每个输入提供它们的列表。
https://stackoverflow.com/questions/72699261
复制相似问题