为了解决语义分割问题,我正在处理一个2K图像的数据集。我想检测和定位小对象,最小的掩码是5x5像素。这些图像包括5种不同的纹理,彼此之间有很大的不同。
我正在使用Unet和EfficientNetb0-3作为骨干,但无论我做什么,我都不适合。我得出的结论是,这很可能是因为分辨率太高,而且差异也太大。
你对我如何克服这个不合身的问题有什么建议吗?
发布于 2021-02-25 11:49:32
考虑到您的掩码非常小,您应该考虑将卷积减小到2x2,因为这将有助于从这些较小的掩码中聚合更多的信息。EfficientNet有3x3和5x5卷积,它们可能不适合您的目的。
使用较小的卷积(2x2)从零开始训练是一个更好的主意。此外,由于你将失去转移学习的优势,看看自我培训,如果这是可能的,你的网络。
https://datascience.stackexchange.com/questions/89690
复制相似问题