首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >随机森林分类器中"class_weight“参数的正确使用

随机森林分类器中"class_weight“参数的正确使用
EN

Stack Overflow用户
提问于 2019-10-08 02:20:40
回答 1查看 815关注 0票数 1

我有一个多类分类问题,我正在尝试使用随机森林分类器。目标严重不平衡,具有以下分布-

代码语言:javascript
复制
1    34108

4     6748

5     2458

3      132

2       37

7       11

6        6

现在,我使用RandomForest分类器的"class_weight“参数,据我所知,与类关联的权重的形式为{class_label: RandomForest}。

所以,下面的方法是正确的:

代码语言:javascript
复制
rfc = RandomForestClassifier(n_estimators = 1000, class_weight = {1:0.784, 2: 0.00085, 3: 0.003, 4: 0.155, 5: 0.0566, 6: 0.00013, 7: 0.000252})

谢谢你的帮忙!

EN

回答 1

Stack Overflow用户

发布于 2020-07-02 12:16:26

如果选择class_weight = "balanced",则类的权重将与它们在数据中出现的频率成反比。

在您的示例中,您对表示过多的类的权重比表示不足的类更重。我相信这与你想要实现的目标相反。

计算每个类别的权重的基本公式是total observations / (number of classes * observations in class)

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/58275113

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档