文章/答案/技术大牛

发布

社区首页 >问答首页 >理解MaskRCNN注解给料

问理解MaskRCNN注解给料
EN

Stack Overflow用户

提问于 2021-12-15 07:03:53

回答 1查看 58关注 0票数 1

我目前正在使用Matterport MaskRCNN进行一个对象检测项目。

作为工作的一部分，是检测一个绿色叶跨越白色网格。到目前为止，我已经用这样的方式定义了注释(多边形)，使得跨越网络的每一片叶子 (并给出白色-绿色-白色模式)被认为是一个有效的注释。

但是，当将上述定义从单交叉注释更改为多个交叉(一次跨越多个页面)时，我开始在测试阶段看到模型性能严重下降。

这就提出了我的问题--两者之间唯一的区别在于注释的大小。所以：

在MaskRCNN的培训中，下列哪一项对学习影响更大--模式、还是size？

如果这种模式有影响力，那就更好了。因为我们的目标是找出一个交叉口。相反，如果注释的大小是影响者，那就是一个问题，因为我不希望模型在图像中寻找多个交叉或者大的单交叉。

P.S. -欢迎参考解释该主题的推荐条款。

提前感谢

deep-learning

conv-neural-network

object-detection

mask

image-segmentation

回答 1

Stack Overflow用户

回答已采纳

发布于 2022-08-09 12:46:19

如果我正确地理解了注释的形状，那么如果采用多元注释的话，注释的形状就会越来越长。

在这种情况下，您可以更改扫描图像对象的锚的大小和边比。在默认设置下，模型通常有四边形的边框。这意味着非常长和很窄的注释会创建宽度和高度之间有很大差异的边框。这些对象似乎更难通过模型进行分割和检测。

这些是config.py文件中的默认配置：

方锚边长度(以像素为单位)

RPN_ANCHOR_SCALES = (32，64,128,256,512)

每个单元的锚固比(宽度/高度)。值1表示方形锚，0.5表示宽锚

RPN_ANCHOR_RATIOS = 0.5，1，2

您可以在推理模式中使用这些值，并查看它是否提供了一些更好的结果。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/70359575

复制

相似问题

问理解MaskRCNN注解给料
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问理解MaskRCNN注解给料EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问理解MaskRCNN注解给料
EN