我开始了我的第一个真正的数据科学项目,我做了一个研究,并想问我的方法是否正确:
我有: 600张电子元器件的照片,一张照片中有数百个组件,它们之间的形状和距离可能不同,但一张照片中只有一个形状。组件形状为方形、长方形、椭圆形、“E”型-shape和类似的
我需要:组件的通用计数器(不管照片上的元素是什么类型)
计划的方法:用openCV分析每一张图片以获得预测,然后用Tensorflow和GPU训练CNN (没有以前的经验)。
这是正确的思维方式吗?
发布于 2018-05-01 17:56:49
对于您的情况,我建议使用对象检测网络来定位和分类您的组件。虽然您不需要位置或分类数据,但仍然可以计算网络检测到的对象数量。而且,这种方法不需要任何数据科学背景,因为有许多关于这个主题的教程和大量的开箱即用的工具,比如tensorflow的对象检测。
您将需要注释您的数据,但有大量的程序来帮助您这一点。这是我很快找到的。
我建议在NAS特征提取器中使用更快的RCNN,因为尽管它比其他CNN架构慢,但它是最精确的。此外,如果不将所有组件组合到一个类中,则网络的性能可能会更好。
完成这项任务所需的步骤基本上如下:
https://datascience.stackexchange.com/questions/18323
复制相似问题