我的目标是建立一个目标检测模型,我用方形框标记数据,如果我用多边形标记图像,它会比方形更好吗?
(在戴安全帽或不戴安全帽的人的图像上贴上标签)
我确实尝试过在一些图片上贴上多边形形状的标签,在导出txt文件后,为什么它在文本文件中只有4个点,就像用正方形标记的一样,这些点如何表示我所准确标注的区域?
1 0.573748 0.018953 0.045332 0.036101
1 0.944520 0.098375 0.108931 0.167870发布于 2021-04-09 10:07:35
您已经将对象标记为多边形格式,但是当您将对象转换为YOLO格式时,标签中的信息减少了。下面的图片显示了我认为是如何发生的;

...where您已经做了多边形形状注释(黑色形状)。但是,转换从多边形坐标点“搜索”最小x值,从对应多边形坐标点搜索最小y值。而且,这些是YOLO格式的“前两个”值。同样的逻辑也发生在“宽度”和“高度”-parameters上。
关于标签和数据集背后的想法的一个很好的描述在pqfM中。
简而言之,为了您的目的(为了提高效率),我建议您只使用矩形进行快速方便的注释--而不是耗时的多边形注释。
发布于 2021-12-04 16:03:34
您正在使用的YOLO很可能只有方形注释支持。请参见这段视频显示结果的平方和多边形质量以进行检测,以及创建自定义数据集所需的注释时间问题。
要使用多边形掩码,我可以建议改用YOLOv3-多边形或YOLOv5-多边形吗?
https://stackoverflow.com/questions/67016228
复制相似问题