我正在尝试实现一种算法,在这种算法中,给定一个平面表上有多个对象的图像,所需的是每个对象的分割掩码的输出。与CNN不同的是,这里的目标是在不熟悉的环境中检测物体。解决这个问题的最佳方法是什么?此外,网上是否有任何实现示例?
编辑:对不起,问题可能有点误导人。我所说的“不熟悉的环境”的意思是,该算法可能不知道对象。算法不需要了解对象是什么,而应该只检测对象。我应该如何处理这个问题?
发布于 2018-04-25 20:36:52
平均位移LSH是O(n^2)中著名的Mean算法在O(n)中的一次升级,因其图像分割能力而闻名。
的一些解释
如果你想要一个真正的无监督的方法分割图像,使用聚类算法。事实上,有很多算法具有不同的时间复杂度和特异性。以最著名的K-Means为例,它在O(n)中的速度非常快,但您必须指定您想要的集群数量--这不是您想要的--通过探索一个未知的图像,而没有任何信息说明其中有多少个形状。此外,即使你假设你知道有多少形状存在,我们也可以假设形状是随机的,这是K-Means失败的另一点,因为它是为了寻找椭圆簇而不是随机形状的。
相反,我们有一个均值偏移,它能够自动找到集群的数目--当你不知道你在寻找什么的时候,这是有用的--随机形状。
当然,您可以将K参数K-Means替换为其他的Shift参数,这可能很难精确调优,但如果您不练习魔术,则不存在允许您执行魔术的工具。
的建议
转换您的颜色空间从RGB到LUV,这是更好的欧几里德距离。
Mean较慢,但更适合您的需要。它仍然是线性的,并且使用上述实现也是可伸缩的。
PS :我的个人资料图片是一个应用的均值移动LSH在我自己,如果它可以帮助了解它如何工作。
发布于 2018-04-25 13:52:43
您可能需要查看一下提交并接受的2018年CVPR:学会分割每一件事物的这项工作。
在这项工作中,他们试图分割所有东西,甚至是网络所不知道的对象。掩码R-CNN已经被使用,与一个传输学习子网络相结合,它们在分割几乎所有东西上都取得了很好的效果。
发布于 2018-04-23 15:37:13
事实上,你的任务是被监督的。对于您的目的,Segnet可以是一个很好的体系结构,它的实现之一可以被这里访问。SegNet从监督学习中学习预测像素级标签.因此,我们需要一个输入图像的数据集与相应的地面真相标签。标签图像必须是单个通道,每个像素都用其类..。标记。
另外,请看一看全卷积网络,它非常适合您的任务。
根据问题中的编辑,我添加了额外的信息。有许多方法可以应用于此任务。基本上,最简单的方法是使用背景标签,并通过使用上述体系结构对那些您不知道为背景的类进行分类。通过这样做,您将拥有可能与背景类重叠的标签,这可能是这种方法的缺点之一,但它的优点是,在输入中经常使用训练有素的标签的情况下,您可以使用相对较轻的体系结构版本来识别未知类。
https://datascience.stackexchange.com/questions/30697
复制相似问题