我想用深度学习算法对5个不同的对象进行分类。我计划使用迁移学习。对于两个类,我有超过2000个数据集,并且可以收集更多。然而,对于另外3个班级,我每个班级总共只有300个。
例如,假设我们有一个二进制类“非欺诈”和“欺诈”类。绝大多数交易将属于“非欺诈”类别,极少数交易将属于“欺诈”类别。
PS。如果我可以使用其中一个大小的数据集作为一个类,而其余的作为另一个类,那么这个问题就可以变成一个二进制分类问题。我想知道你是否能告诉我如何管理这种不平衡的训练数据?
提前谢谢你。
发布于 2019-09-09 23:25:31
您可以尝试使用SMOTE (合成少数过采样技术)对少数类实例进行过采样。
发布于 2019-09-10 01:18:11
仅在少数类上执行一些图像数据增强。
https://stackoverflow.com/questions/57856023
复制相似问题