因此,我正在为一个用例实现CNN项目的需求收集阶段。我很想知道AI/ML行业是如何为特定用例挑选合适的模型的。我看到有很多CNN架构,但是如何选择适合我需求的架构呢?
它是仅在逐一尝试的基础上完成的,还是有任何特定的方法来选择正确的体系结构?如果这是一个试错的过程,它不是很麻烦吗?如果我们只需要使用试错法,那么它能帮助我们多久呢?
发布于 2020-04-23 12:23:06
说架构,如果你指的是
所有这些都是由不同的团体建立的,以参与每年都会发生的image-net wiki挑战赛。每个架构只对应于一个用例,用于在1000个不同类别的中对图像进行分类的。所以,我不认为架构可以通过用例来区分。也就是说,您可以通过以下标准来考虑架构,
对于使用不同架构构建的模型的准确性(最高表示最好),以及它对测试/新传入数据的泛化程度,这也是非常有限的时间和图形处理器内存限制( important.
发布于 2020-04-24 18:11:12
通常你会有一些限制,这将帮助你缩小你的选择范围。例如,如果您需要为移动设备进行开发,那么最好的选择是MobileNets或ShuffleNet架构。您可以在ILSVRC验证集上检查每个候选模型的性能,并了解它们的相对性能。从那里,您可以选择在您的约束(可用的培训资源,推理过程中的时间/内存限制)内表现最好的模型。如果使用迁移学习,则需要确定要冻结的层数。尽管这将取决于你的训练数据(更多的数据意味着你可以微调更多的层,而不会有过度拟合的风险),但仍然会涉及一些试验和错误。然后,根据您拥有的时间和资源,您可以研究其他模型。
https://stackoverflow.com/questions/61379006
复制相似问题