我正在尝试重现MobileNetV2论文(arXiv:1801.04381)中报告的SSDLite模型的结果,该模型在COCO检测挑战中应该可以获得约22.1%的mAP。然而,我被困在9%的mAP。这是奇怪的行为,因为该模型确实在一定程度上起作用,但与报告的结果仍相去甚远。这么大的差距是由超参数/优化器选择造成的吗(我使用的是adam而不是sgd),或者几乎可以肯定我的实现中有一个bug?
值得一提的是,该模型成功地过拟合了训练集的一小部分,但在整个训练集上,损失似乎相当快地达到了平台期。
有谁遇到过类似的问题吗?
发布于 2020-01-11 23:04:43
这么大的差距是由超参数/优化器选择造成的吗(我使用的是adam而不是sgd),或者几乎可以肯定我的实现中有一个bug?
即使超参数的微小变化和不同的优化器选择也会对训练和分类器的最终精度产生很大影响。因此,您的低精度可能不一定是由于bug,但也可能是由于错误的参数化。
还值得一提的是,该模型成功地过拟合了训练集的一小部分,但在整个训练集上,损失似乎相当快地达到了平台期。
似乎你遇到了一个局部最优,它只对你的数据的一个子集有效,它也可能是一个次优参数化的指针。
就像@Matias Valdenegro也提到的那样,要再现准确的结果,您可能必须使用与原始实现中相同的参数。
https://stackoverflow.com/questions/59689877
复制相似问题