我正在使用XGBClassifier进行python训练,在我的训练数据集中有一些分类变量。最初,我计划在添加数据之前将它们每个都转换为几个虚拟对象,但随后将计算每个虚拟对象的特征重要性,而不是原始的分类对象。由于我还需要按重要性对所有原始变量(包括数字+分类)进行排序,因此我想知道如何获得原始变量的重要性?这是简单的累加吗?
发布于 2018-11-16 04:24:21
您可能可以将各个类别的重要性汇总到它们的原始父类别中。但是,除非这些功能是高基数的,否则我的两点意见是单独报告它们。我倾向于在报告模型性能/重要性度量方面更加明确。
https://stackoverflow.com/questions/53327334
复制相似问题