首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >集合技术.套袋子集大小

集合技术.套袋子集大小
EN

Data Science用户
提问于 2019-10-07 06:29:26
回答 2查看 181关注 0票数 1

我确实有一个关于合奏技巧的问题,套袋/助推。-套袋的子集大小是多少?

EN

回答 2

Data Science用户

发布于 2019-11-06 10:09:23

正如在前面的答案中所说的,准确的子样本参数值取决于您的数据。

但是,一个通常的启动参数,通常可以获得良好的结果,并且不会对数据分布造成太大的影响,它是0.9。

在每次迭代或新建树时取出10%的数据,可以使模型泛化得更好一些。您可以试用0.9的不同变体,并查看结果。

票数 1
EN

Data Science用户

发布于 2019-10-07 09:20:41

套袋描述了基于平均结果的预测,多个模型,您在随机数据子集上创建了培训。

例如,在scikit中,您可以使用max_samples配置打包模型,告诉他要使用多少个子集。(参见sklearn:https://scikit-learn.org/stable/modules/generated/sklearn.ensemble.BaggingClassifier.html)

如果你在问“应该”有多高,答案取决于你的培训数据总量。

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/61362

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档