对于像“狗”这样的一般项目，经过预先训练的模型是很容易获得的。一个很好的起点是ImageNet。对于这个数据集，有许多预先训练过的模型可用，例如，参见这里 for PyTorch。由于ImageNet包含给定项的多个类别，所以可以检查这份清单以查看哪些索引对应于哪些项，并定义映射(例如，狗类为151-268类)。

完成之后，手动检查标签和传输模型不一致的情况。

票数 3

Data Science用户

发布于 2020-01-10 14:06:25

一种可能的方法是使用经过预先训练的模型来标记你刮过的照片，看看它们是否包含狗的照片。然后，为了保持简单，使用它作为一个粗略的过滤器，看看个人的照片是否适合你的模型。

如果您的任务非常具体，可能很难找到经过预先培训的图像识别模型:另一种方法是手动标记您的第一条~100条记录或其他任何东西，这样它们就有了值得信任的标签。然后，你可以积极地增加这些图像，直到你有一个合理的数量，并训练一个分类器来预测“狗在图片中存在，而不是狗在图片中”然后使用这个小的，简单的模型作为你的“粗糙过滤器”来决定在你的更大，更复杂的建模数据中包含哪些图像。

票数 1

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/66272

复制

相似问题

问图像数据的数据质量评价
EN

回答 2

Data Science用户

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问图像数据的数据质量评价EN

回答 2

Data Science用户

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问图像数据的数据质量评价
EN