首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >sklearn集成的自定义random_sampling

sklearn集成的自定义random_sampling
EN

Stack Overflow用户
提问于 2020-04-19 02:34:33
回答 1查看 87关注 0票数 2

我需要在scikit中编写一个自定义random_selection (用于随机选择特征,即"max_feature“和训练数据的子集,即”子样本“)模块,以便与sklearn.ensemble.RandomForestClassifier和GradientBoostingClassifier一起使用。有人能举出一些例子/文档/讨论等吗?想法是在RandomForestClassifier中使用训练数据中的一列(不依赖,即Y)进行分层

EN

回答 1

Stack Overflow用户

发布于 2020-04-25 05:04:14

看起来你有两个主要的选择:

,,

  1. ,你可以手动遍历学习器。它会非常慢,但你可以手动输入采样数据。

或者2.你可以通过类别比例的倒数来加权样本(例如,如果你的数据是a,a,b,那么样本权重将是5/2,5/2,5/3,5/3,5/3或类似的东西。这样,对于该变量的每个值,对损失的总贡献是相等的。您可以通过将权重输入到model.fit(X, y, sample_weight=sample_weight)中来完成此操作。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/61294265

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档