我试图使用yolov7预训练模型上的传输学习来预测自定义数据集上的边界框。
我的数据集包含34个训练场景,2个验证场景和5个测试场景。现场什么都没发生,只是摄像机在桌子/平面上的物体周围移动60-70度,鳞片/倾斜一点。所以,即使我有大约20k的训练图像(从34个场景中提取),从每个场景中,我得到的图像几乎是一样的,具有一种增强效果(缩放、旋转、遮挡和倾斜来自摄像机运动)。
这里是一个场景的例子(第一帧和最后一帧)


现在,我尝试了不同的东西。
其中一些工作(准确地预测包围框的准确率为100%,但召回率较低,有时使用错误的类标签),但我面临的最大问题是,对于验证,对象丢失永远不会下降(无论我尝试哪种方法)。这甚至从一开始就发生了,所以我不确定我是否过分适应。
下面的图是从传输学习的微小模型冻结骨干。

对于如何解决问题和取得更好的效果,有什么建议吗?
发布于 2022-11-20 13:08:57
首先,我建议您彻底检查您的数据集。
- How many classes do you have, and what are the counts of the objects of these classes in the training set?
- What are the counts in the validation set? Are the ratios approximately similar or different?
- Is any class lacking examples (i.e. is too few by proportion)?
- Do you have enough background samples? (Images where no desired object is present)https://stackoverflow.com/questions/74507437
复制相似问题