我有一个随机的森林分类器,它给了我一个特征重要性排名。
我如何才能得出重要特征的统计意义,就像你可以推断betas的统计意义的回归模型一样?
发布于 2018-07-24 16:21:46
你的问题有点太宽泛和不明确了。
查看feature_importance_值作为百分比的一种简单方法是对它们的值进行标准化
importance_sum = sum(clf. feature_importances_)
feature_importance_as_percent = [100*(x/sum) for x in clf.feature_importances_]其他方法将涉及参数或非参数测试。
另请阅读:How are feature_importances in RandomForestClassifier determined?
https://stackoverflow.com/questions/51487682
复制相似问题