首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >CNN输入识别花卉的数据增强

CNN输入识别花卉的数据增强
EN

Data Science用户
提问于 2018-09-23 16:36:46
回答 1查看 95关注 0票数 2

我想做一个神经网络,从这样的图像中识别花朵:

或类似的图像,例如在https://www.pexels.com/search/flowers/

我想用CNN来做这个,就像在https://stackoverflow.com/questions/52463538/reducing-memory-requirements-for-convolutional-neural-network里一样

我的问题是:

  1. 哪一种更好:将整个图像放入训练集,还是将每幅图像分成4部分(中线、水平和垂直切割)?
  2. 如果我旋转/倾斜这些图像并将它们放置在训练集中,会有帮助吗?
  3. 如果我模糊这些图像并将它们放在训练集中,会有帮助吗?

网络的主要目的是识别它是哪种花。为此,它将接受大约20朵花的图像训练。因此,分类是目标。

编辑:我们可以假设在一个图像中只会有一种花。

EN

回答 1

Data Science用户

回答已采纳

发布于 2018-09-23 18:47:00

正如您已经提到的,您的任务是分类,由于使用图像,它更好地使用卷积神经网络。首先,我有一个建议,试图找到一个适当的大小与相同的尺寸,所有的图像,并提供给你的网络。您可以保持高宽比或不取决于您要测试您的模型的环境。您还可以查看为什么我们在把图片输入网络之前先缩小它们的比例?

哪一种更好:将整个图像放入训练集,还是将每幅图像分成4部分(中线、水平和垂直切割)?

我猜你试图做数据增强。如果是的话,这要看情况而定。如果这样做,您可能有不包含花的图像,或者它们可能包含在不同类中常见的花的一部分。因此,它可能会增加Bayes误差。如果你确信你没有这些问题,你可以使用它,尽管我不这么认为。

如果我旋转/倾斜这些图像并将它们放置在训练集中,会有帮助吗?

是的,这比以前的技术好多了。你必须意识到这在某些情况下是危险的。基本上,您应该使用训练集来训练您的网络,培训集是从您的测试数据的真实分布中提供的_i.i.d_ly。假设在测试您的模型时,您的测试数据都来自垂直放置在场景中的鲜花。在这种情况下,如果您使用刚旋转的版本来训练您的网络,您可能没有一个好的测试结果。

如果我模糊这些图像并将它们放在训练集中,会有帮助吗?

和前面的答案一样,它也取决于您的测试数据。如果这是在测试过程中发生的事情,那么它是合法的。

我没有注意到这些图像。根据我们朋友的评论,我更新了答案。你的课可以是这些东西之一。它们可以是详尽的,也可以是相互排斥的,也可以是相互排斥的。如果前者满足,这意味着输入至少应该属于一个类。后者意味着,如果您有互斥类,则输入应该只包含一个类。如果它们不是相互排斥的,则可以在一个输入中包含多个类。

要为上面的答案添加一个更新,您应该考虑到数据的增强和缩减可能是困难的,因为它需要专家手工标记输入,这很费时。

票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/38682

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档