首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何在机器学习数据集中打击不平衡的类

如何在机器学习数据集中打击不平衡的类
EN

Stack Overflow用户
提问于 2019-09-09 22:28:16
回答 2查看 138关注 0票数 1

我想用深度学习算法对5个不同的对象进行分类。我计划使用迁移学习。对于两个类,我有超过2000个数据集,并且可以收集更多。然而,对于另外3个班级,我每个班级总共只有300个。

例如,假设我们有一个二进制类“非欺诈”和“欺诈”类。绝大多数交易将属于“非欺诈”类别,极少数交易将属于“欺诈”类别。

PS。如果我可以使用其中一个大小的数据集作为一个类,而其余的作为另一个类,那么这个问题就可以变成一个二进制分类问题。我想知道你是否能告诉我如何管理这种不平衡的训练数据?

提前谢谢你。

EN

回答 2

Stack Overflow用户

发布于 2019-09-09 23:25:31

您可以尝试使用SMOTE (合成少数过采样技术)对少数类实例进行过采样。

link here for SMOTE

票数 0
EN

Stack Overflow用户

发布于 2019-09-10 01:18:11

仅在少数类上执行一些图像数据增强。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/57856023

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档