我是目标检测的新手,我有泰米尔语字符,并且我使用CNN成功地完成了分类部分。
对于对象检测,我遵循这个示例- https://towardsdatascience.com/getting-started-with-bounding-box-regression-in-tensorflow-743e22d0ccb3
我们必须创建边界框并创建注释文件,该文件包含图像中存在的对象数量和对象的(Xmin,Ymin),(Xmax,Ymax)坐标。
在我的项目中,我有一个数据集,其中每个图像都只有一个字符


如何创建所有字符都已经在感兴趣区域中的边界框…
谢谢
发布于 2020-03-19 15:19:50
LabelImg是在图像上创建边界框的最常用工具。
此外,您还提到所有字符都在感兴趣的区域内,一种方法是创建一个包含所有这些字符的新图像,然后手动为每个添加边界框。
还值得注意的是,对象检测算法还考虑包含所述对象的环境环境,因此,在包括训练中的期望对象的环境中的更多方差将在暴露于外来/新环境时产生更健壮的模型。
此外,还应考虑使用数据增强,如rotation、scaling和translation.由于这些参数在实时检测中也会遇到,因此也有助于建立更鲁棒的模型,该模型可以在变化的环境中准确地检测。
您可以在此link中阅读有关张量流数据增强的更多信息。
https://stackoverflow.com/questions/60576466
复制相似问题