我使用对象检测器(yolo v5)来检测和识别水下视频中的鱼。我有一个标记的数据集,但是一些鱼很难被注释者正确识别,所以它们被标记为“未知”,而不是用物种名称。
我的本能是训练包括“未知”的课程,但要把它从测试集中删除。理由是,我们的目标是物种识别,而将“未知”鱼类识别为物种的分类器不应因此而受到惩罚。我们只对该物种的标签的准确性感兴趣。
一位同事不同意,认为训练集和测试集应该有相同的分布。
有什么想法?处理这件事最好的方法是什么?
发布于 2022-11-15 17:24:22
这取决于如何定义任务,即模型的目标是什么:
https://datascience.stackexchange.com/questions/116191
复制相似问题