开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

社区首页 >问答首页 >CNN输入识别花卉的数据增强

问CNN输入识别花卉的数据增强
EN

Data Science用户

提问于 2018-09-23 16:36:46

回答 1查看 95关注 0票数 2

我想做一个神经网络，从这样的图像中识别花朵：

或类似的图像，例如在https://www.pexels.com/search/flowers/上

我想用CNN来做这个，就像在https://stackoverflow.com/questions/52463538/reducing-memory-requirements-for-convolutional-neural-network里一样

我的问题是：

哪一种更好:将整个图像放入训练集，还是将每幅图像分成4部分(中线、水平和垂直切割)？
如果我旋转/倾斜这些图像并将它们放置在训练集中，会有帮助吗？
如果我模糊这些图像并将它们放在训练集中，会有帮助吗？

网络的主要目的是识别它是哪种花。为此，它将接受大约20朵花的图像训练。因此，分类是目标。

编辑:我们可以假设在一个图像中只会有一种花。

machine-learning

image-classification

EN

回答 1

Data Science用户

回答已采纳

发布于 2018-09-23 18:47:00

正如您已经提到的，您的任务是分类，由于使用图像，它更好地使用卷积神经网络。首先，我有一个建议，试图找到一个适当的大小与相同的尺寸，所有的图像，并提供给你的网络。您可以保持高宽比或不取决于您要测试您的模型的环境。您还可以查看为什么我们在把图片输入网络之前先缩小它们的比例？。

哪一种更好:将整个图像放入训练集，还是将每幅图像分成4部分(中线、水平和垂直切割)？

我猜你试图做数据增强。如果是的话，这要看情况而定。如果这样做，您可能有不包含花的图像，或者它们可能包含在不同类中常见的花的一部分。因此，它可能会增加Bayes误差。如果你确信你没有这些问题，你可以使用它，尽管我不这么认为。

如果我旋转/倾斜这些图像并将它们放置在训练集中，会有帮助吗？

是的，这比以前的技术好多了。你必须意识到这在某些情况下是危险的。基本上，您应该使用训练集来训练您的网络，培训集是从您的测试数据的真实分布中提供的_i.i.d_ly。假设在测试您的模型时，您的测试数据都来自垂直放置在场景中的鲜花。在这种情况下，如果您使用刚旋转的版本来训练您的网络，您可能没有一个好的测试结果。

如果我模糊这些图像并将它们放在训练集中，会有帮助吗？

和前面的答案一样，它也取决于您的测试数据。如果这是在测试过程中发生的事情，那么它是合法的。

我没有注意到这些图像。根据我们朋友的评论，我更新了答案。你的课可以是这些东西之一。它们可以是详尽的，也可以是相互排斥的，也可以是相互排斥的。如果前者满足，这意味着输入至少应该属于一个类。后者意味着，如果您有互斥类，则输入应该只包含一个类。如果它们不是相互排斥的，则可以在一个输入中包含多个类。

要为上面的答案添加一个更新，您应该考虑到数据的增强和缩减可能是困难的，因为它需要专家手工标记输入，这很费时。

票数 1

EN

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/38682

复制

相似问题