我正在使用tensorflow对象检测应用程序接口(https://github.com/tensorflow/models/tree/master/research/object_detection)通过单镜头多盒检测器(SSD)训练CNN,然后检测图像/视频中的对象。有没有什么方法可以在网络中实现热图来提高模型的准确性?如果没有,你能建议我用其他方法来改进模型吗?
提前感谢
发布于 2020-02-25 05:07:07
答案取决于你真正想从这项工作中得到什么。如果你只是想要一个工作良好的模型,而不了解幕后发生了什么,我建议你尝试一些高级服务,比如来自谷歌云平台的AutoML。
相反,如果你对它背后的技术感兴趣,你应该首先阅读原始的SSD论文,以深入了解它是如何工作的。之后,您可以尝试使用在.config文件中找到的参数。
我个人会从更改特征提取器开始,使用一个更准确(但可能更慢)的特征提取器,比如VGG16或ResNet,而不是MobileNet (快速但不太准确)。
然后,您可以尝试更改锚点的大小及其形状,始终从.config文件进行更改。
然而,我真的建议不要使用试错的方法,因为很有可能你最终会失去大量的时间来等待你的训练结束。有一些简单但有用的技术可以避免这种情况:例如,我建议你尝试使用最强大的配置,而不是正则化,看看长时间的训练是否能够产生一个至少超过你的数据集的模型,并且在这个模型上工作得很好。如果这不起作用,那就意味着你的网络还不够深/不够大,你应该为此努力。
在我的个人经验中,我发现预处理图像没有我预期的那么有用,特别是在使用迁移学习时。
https://stackoverflow.com/questions/49780251
复制相似问题