我正在建立一个基于最近发布的tensorflow对象检测API的对象检测管道。我正在使用arXiv作为指导。我希望了解下面的培训在我自己的数据集。

发布于 2017-07-05 20:43:06
对于问题1和问题2:与原始文件相比,我们的实现在一些小细节上有所不同,在内部,我们使用大约10个GPU的异步SGD训练我们的所有检测器。我们的学习率是为这个设置校准的(如果您决定通过Cloud引擎进行训练,就像宠物演练中一样)。如果您使用另一个设置,您将不得不做一些超参数探索。对于单个GPU来说,保持单独的学习速度可能不会影响性能,但是通过增加它,您可以获得更快的收敛速度。
对于问题3:训练损失不稳定地减少,只有当你在相当长的一段时间里平滑一些情节时,你才能看到减少。此外,很难通过查看培训损失来明确地说明您在eval度量方面做得有多好。我建议您查看mAP图以及图像可视化,以真正了解您的模型是否已经“起飞”。
希望这能有所帮助。
https://stackoverflow.com/questions/44911704
复制相似问题