首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >不同训练图像个数的图像分类

不同训练图像个数的图像分类
EN

Data Science用户
提问于 2018-07-29 14:29:36
回答 2查看 1.3K关注 0票数 3

我试着用4种不同的类别训练神经网络来进行图像分类:

  1. 汽车(22k训练例子)
  2. 大楼(8k培训实例)
  3. 行人(5k训练例子)
  4. 树木(1k训练实例)

问题是训练图像的数量偏向于一个/两个类(Es)。

我想知道是否有一种方法来训练神经网络,根据每堂课训练样本的数量?

我是否必须将每堂课的训练样本数目限制在所有课程的最少数目?

EN

回答 2

Data Science用户

回答已采纳

发布于 2018-07-30 05:37:14

没有不平衡的不同类的数据并不重要。重要的是,您的数据应该有一个真正的分布。培训数据的分布应该与测试环境相同。因为您可以阅读这里,所以您的数据应该非常适合将要使用的任务。因此,如果你的样品的分布是真实的,就不会有问题。考虑一下,对于不平衡的数据集,我们应该使用适当的评估指标,比如F1评分。

最后,如果这是数据的真实分布,我强烈建议您不要更改实际分布,即使您想要增加数据。不应更改不同类的相对比率。

票数 0
EN

Data Science用户

发布于 2018-07-29 17:05:10

有时,一个类比另一个类更常见。这通常都是值得思考的。我想这并不是您所描述的那样(也就是说,人们以后想要对生产中的图像进行分类的事情是任意的),所以让我们忽略这种情况(尽管它可能会影响测试集上的性能,这取决于测试集中最常见的是什么)。不过,一般来说,您会尝试一些策略(例如,不过度采样(无论是否有某种程度的数据增加),并在真实的测试集上测试它们的性能。

绝对不要扔掉任何图像。通常情况下,我们很难在数据增强中创建真实的图像--在这里,您已经拥有了它们!因此,一种更吸引人的方法是使用一个数据生成器来平均地(或以任何比例对每个类进行最有意义的采样)来创建一批培训数据(包括一些数据增强,例如轻微的旋转、颜色/饱和度的变化等)。

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/36147

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档