首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何重采样

如何重采样
EN

Data Science用户
提问于 2019-08-01 18:10:57
回答 4查看 167关注 0票数 0

我得处理一个小数据集。我认为我应该利用重放法来扩大种群,提高我的回归算法的性能。我听说过SMOTE,但它用于不平衡数据集中的分类。是否有任何方法来创建小型数据集的合成数据?谢谢。

EN

回答 4

Data Science用户

发布于 2019-08-01 18:28:05

请查看不平衡的图书馆-学习(python)。您有一些代码示例:

代码语言:javascript
复制
#assuming that you have X and y

from imblearn.over_sampling import SMOTE

smote = SMOTE(ratio='minority')
X_sm, y_sm = smote.fit_sample(X, y)

文档:

https://imbalanced-learn.readthedocs.io/en/stable/generated/imblearn.under_sampling.TomekLinks.html

https://imbalanced-learn.readthedocs.io/en/stable/generated/imblearn.over_sampling.SMOTE.html

票数 -1
EN

Data Science用户

发布于 2019-08-02 00:56:12

正如其他人所建议的那样,使用过度抽样平滑,它将平衡您的数据集,并创建更多的示例(基于邻居)等于您的多数类。

票数 -1
EN

Data Science用户

发布于 2019-08-01 18:37:09

您可以使用自举回归

票数 -2
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/56774

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档