我得处理一个小数据集。我认为我应该利用重放法来扩大种群,提高我的回归算法的性能。我听说过SMOTE,但它用于不平衡数据集中的分类。是否有任何方法来创建小型数据集的合成数据?谢谢。
发布于 2019-08-01 18:28:05
请查看不平衡的图书馆-学习(python)。您有一些代码示例:
#assuming that you have X and y
from imblearn.over_sampling import SMOTE
smote = SMOTE(ratio='minority')
X_sm, y_sm = smote.fit_sample(X, y)文档:
https://imbalanced-learn.readthedocs.io/en/stable/generated/imblearn.under_sampling.TomekLinks.html
https://imbalanced-learn.readthedocs.io/en/stable/generated/imblearn.over_sampling.SMOTE.html
发布于 2019-08-02 00:56:12
正如其他人所建议的那样,使用过度抽样平滑,它将平衡您的数据集,并创建更多的示例(基于邻居)等于您的多数类。
发布于 2019-08-01 18:37:09
您可以使用自举回归。
https://datascience.stackexchange.com/questions/56774
复制相似问题