查找有关对象检测API的图像注释格式的帮助。
正如我们所知,图像有两种注释格式,Pascal和COCO格式。两者都有自己的规范,以下是两者之间的主要区别:
Pascal:
COCO:
我有两个数据集要处理,这就是如何对它们进行注释。
数据集-1:
数据集-2:
我无法通过的是应该遵循哪种格式(Pascal或COCO)将我的注释转换为Tfrecords(.xml到.records),因为use可以看到dataset的注释不完全属于一种格式。
例如,在此链接中,作者编写了一个脚本将.xml转换为.records,但这里处理的是纯pascal格式。
在此链接中,它们处理的是纯COCO注释格式。
当我站在这两种格式的中间时,我应该走哪条路?
发布于 2021-05-08 13:05:52
当我站在这两种格式的中间时,我应该走哪条路?
create_tf_example函数此链接进行以下更改
对于索引,行在group.TextLine.iterrows()中:xmin.append(行‘X’/imgwidth)xmax.append((行‘X’+行‘宽度’)/imgwidth)ymin.append(行‘y’/imghL.8)ymax.append(行‘y’+行‘’Height‘/imgheight)ymax.append如果您的.xml注释中有X、Y、宽度、高度,而不是xmin、ymin、xmax、ymax。
https://stackoverflow.com/questions/67344221
复制相似问题