我目前正在使用Matterport MaskRCNN进行一个对象检测项目。
作为工作的一部分,是检测一个绿色叶跨越白色网格。到目前为止,我已经用这样的方式定义了注释(多边形),使得跨越网络的每一片叶子 (并给出白色-绿色-白色模式)被认为是一个有效的注释。
但是,当将上述定义从单交叉注释更改为多个交叉(一次跨越多个页面)时,我开始在测试阶段看到模型性能严重下降。
这就提出了我的问题--两者之间唯一的区别在于注释的大小。所以:
在MaskRCNN的培训中,下列哪一项对学习影响更大--模式、还是size?
如果这种模式有影响力,那就更好了。因为我们的目标是找出一个交叉口。相反,如果注释的大小是影响者,那就是一个问题,因为我不希望模型在图像中寻找多个交叉或者大的单交叉。
P.S. -欢迎参考解释该主题的推荐条款。
提前感谢
发布于 2022-08-09 12:46:19
如果我正确地理解了注释的形状,那么如果采用多元注释的话,注释的形状就会越来越长。
在这种情况下,您可以更改扫描图像对象的锚的大小和边比。在默认设置下,模型通常有四边形的边框。这意味着非常长和很窄的注释会创建宽度和高度之间有很大差异的边框。这些对象似乎更难通过模型进行分割和检测。
这些是config.py文件中的默认配置:
方锚边长度(以像素为单位)
RPN_ANCHOR_SCALES = (32,64,128,256,512)
每个单元的锚固比(宽度/高度)。值1表示方形锚,0.5表示宽锚
RPN_ANCHOR_RATIOS = 0.5,1,2
您可以在推理模式中使用这些值,并查看它是否提供了一些更好的结果。
https://stackoverflow.com/questions/70359575
复制相似问题