首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >tensorflow对象检测api将图像注释格式转换为of记录

tensorflow对象检测api将图像注释格式转换为of记录
EN

Stack Overflow用户
提问于 2021-05-01 08:19:10
回答 1查看 2.2K关注 0票数 0

查找有关对象检测API的图像注释格式的帮助。

  • 预测:

正如我们所知,图像有两种注释格式,Pascal和COCO格式。两者都有自己的规范,以下是两者之间的主要区别:

Pascal:

  1. 以.xml文件格式存储注释。
  2. 边框格式x-左上角,y-左上,x-下-右,y-下-右
  3. 为数据集中的每个图像创建单独的xml注释文件。

COCO:

  1. 以.json文件格式存储注释。
  2. 边框格式x-左上角,y-左上角,宽度,高度。
  3. 为每个培训、测试和验证创建一个注释文件。

  • Current-issue:

我有两个数据集要处理,这就是如何对它们进行注释。

数据集-1:

  • 文件格式: Pascal (.xml)
  • 包围框格式:可可。
  • 文件创建:与Pascal (数据集中每个图像的单独xml注释文件)一样。

数据集-2:

  • 文件格式: Pascal (.xml)
  • 包围框格式:可可。
  • 文件创建:如COCO(为每个培训、测试和验证创建一个注释文件)

我无法通过的是应该遵循哪种格式(Pascal或COCO)将我的注释转换为Tfrecords(.xml到.records),因为use可以看到dataset的注释不完全属于一种格式。

例如,在此链接中,作者编写了一个脚本将.xml转换为.records,但这里处理的是纯pascal格式。

此链接中,它们处理的是纯COCO注释格式。

当我站在这两种格式的中间时,我应该走哪条路?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2021-05-08 13:05:52

当我站在这两种格式的中间时,我应该走哪条路?

  1. 使用Pascal格式将.xml转换为.records。
  2. create_tf_example函数此链接进行以下更改 对于索引,行在group.TextLine.iterrows()中:xmin.append(行‘X’/imgwidth)xmax.append((行‘X’+行‘宽度’)/imgwidth)ymin.append(行‘y’/imghL.8)ymax.append(行‘y’+行‘’Height‘/imgheight)ymax.append

如果您的.xml注释中有X、Y、宽度、高度,而不是xmin、ymin、xmax、ymax。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/67344221

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档