我有一个pretrained pytorch模型,我想在fp16而不是fp32上推断,我已经在使用gpu时尝试过了,但是当我在cpu上尝试它时,我得到了:"sum_cpu" not implemented for 'Half' torch。有什么修复方法吗?
发布于 2021-01-11 14:46:59
据我所知,Pytorch中的许多基于CPU的操作都没有实现来支持FP16;相反,从CUDA7.0(Ish)开始,NVIDIA GPU就有了对FP16和PyTorch的硬件支持(例如,Turing arch GPU中的张量内核)。要通过量化到FP16来加速CPU上的推断,您可能需要尝试torch.bfloat16 dtype(https://github.com/pytorch/pytorch/issues/23509)。
https://stackoverflow.com/questions/62112534
复制相似问题