识别具有深度学习(最好是Keras)的场景的方法是什么?有许多例子展示了如何对有限大小的图像进行分类,例如狗/猫、手写字母等。也有一些例子用于检测大图像中的搜索对象。
但是,识别的最佳方法是什么?例如,它是教室、卧室还是餐厅?用这些图像创建一个数据集?我不这么认为。我认为人们应该用可能出现在场景中的许多东西来训练模型,在分析的图像中创建找到的东西的向量,并使用第二个分类器(SVM或简单神经网络)对场景进行分类。这是一种正确的方法吗?
附言:事实上,我正面临着另一个问题,同样的问题。我的“场景”是一个显微镜图像。图像包含不同的单元格和伪像集。根据一组数据,医生会做出诊断。所以我的目标是用这些人工制品来训练CNN,我用简单的形态学方法提取这些人工制品。这些人工制品(例如生物细胞)将是我的特征。因此,第一级识别-特征提取由CNN完成,后一级分类由SVM完成。只是想确认一下,我不是在重复发明轮子。
发布于 2020-05-06 15:57:59
在我看来,你的房间场景和生物场景之间的比较是不同的。特别是因为您的场景是一个显微镜图像(可能是有限的预定义的域)。
在这种情况下,纯分类应该是有效的(不需要查看数据)。换句话说,神经网络应该能够找出它看到的是什么,而不需要你手工制作特征(如果你需要可解释性,这是一个全新的讨论)。
在这个paper中也有很多场景理解的方法。
https://stackoverflow.com/questions/56076205
复制相似问题