我打算在网站上提供pytorch模型(Resnet18)。
然而,在处理器中推理(Amd3600)需要70%的cpu资源。
我不认为服务器(Heroku)可以处理这种计算。
有没有办法在cpu中优化推理?
非常感谢
发布于 2021-09-19 09:18:37
您可以尝试修剪和量化您的模型(压缩模型大小以进行部署的技术,允许加快推断速度并节省能源,而不会造成显著的精度损失)。在pytorch网站上有模型修剪和量化的例子,你可以查看。
https://pytorch.org/tutorials/intermediate/pruning_tutorial.html https://pytorch.org/tutorials/advanced/dynamic_quantization_tutorial.html
https://stackoverflow.com/questions/69241400
复制相似问题