机器学习的新手,所以寻找一些方向,如何开始。最终目标是能够使用Tensorflow训练模型来计算图像中对象的数量。我最初的重点是训练模型来计算一种特定类型的对象。假设我拿了硬币。我只会训练模型去数硬币。不用担心为所有不同类型的对象创建通用计数器。我只做了谷歌的花朵图像分类的例子,我理解它的基本原理。因此,寻找如何开始的线索。这是一个图像分类问题吗?我可以使用与flowers...etc相同的逻辑吗?
发布于 2017-02-22 23:10:10
对于硬币问题,最好的解决方案可能是使用回归来解决这个问题。使用场景中对象的数量注释5k图像,并在其上运行模型。然后你的模型就会输出正确的数字。(希望如此)
另一种方法是对图像是否显示硬币进行分类,并使用像这样的滑动窗口方法:如果显示硬币,则使用https://arxiv.org/pdf/1312.6229.pdf对每个窗口进行分类。然后计算找到的区域。这个更容易注释和学习,也更容易扩展。但在选择好的窗口和以简明的方式使用这些窗口的结果方面存在问题。
https://stackoverflow.com/questions/42375680
复制相似问题