我想做一个神经网络,从这样的图像中识别花朵:

或类似的图像,例如在https://www.pexels.com/search/flowers/上
我想用CNN来做这个,就像在https://stackoverflow.com/questions/52463538/reducing-memory-requirements-for-convolutional-neural-network里一样
我的问题是:
网络的主要目的是识别它是哪种花。为此,它将接受大约20朵花的图像训练。因此,分类是目标。
编辑:我们可以假设在一个图像中只会有一种花。
发布于 2018-09-23 18:47:00
正如您已经提到的,您的任务是分类,由于使用图像,它更好地使用卷积神经网络。首先,我有一个建议,试图找到一个适当的大小与相同的尺寸,所有的图像,并提供给你的网络。您可以保持高宽比或不取决于您要测试您的模型的环境。您还可以查看为什么我们在把图片输入网络之前先缩小它们的比例?。
哪一种更好:将整个图像放入训练集,还是将每幅图像分成4部分(中线、水平和垂直切割)?
我猜你试图做数据增强。如果是的话,这要看情况而定。如果这样做,您可能有不包含花的图像,或者它们可能包含在不同类中常见的花的一部分。因此,它可能会增加Bayes误差。如果你确信你没有这些问题,你可以使用它,尽管我不这么认为。
如果我旋转/倾斜这些图像并将它们放置在训练集中,会有帮助吗?
是的,这比以前的技术好多了。你必须意识到这在某些情况下是危险的。基本上,您应该使用训练集来训练您的网络,培训集是从您的测试数据的真实分布中提供的_i.i.d_ly。假设在测试您的模型时,您的测试数据都来自垂直放置在场景中的鲜花。在这种情况下,如果您使用刚旋转的版本来训练您的网络,您可能没有一个好的测试结果。
如果我模糊这些图像并将它们放在训练集中,会有帮助吗?
和前面的答案一样,它也取决于您的测试数据。如果这是在测试过程中发生的事情,那么它是合法的。
我没有注意到这些图像。根据我们朋友的评论,我更新了答案。你的课可以是这些东西之一。它们可以是详尽的,也可以是相互排斥的,也可以是相互排斥的。如果前者满足,这意味着输入至少应该属于一个类。后者意味着,如果您有互斥类,则输入应该只包含一个类。如果它们不是相互排斥的,则可以在一个输入中包含多个类。
要为上面的答案添加一个更新,您应该考虑到数据的增强和缩减可能是困难的,因为它需要专家手工标记输入,这很费时。
https://datascience.stackexchange.com/questions/38682
复制相似问题