我试图建立一个分段模型,我不断得到"CUDA错误:内存不足“,在调查之后,我意识到所有4个GPU都在工作,但其中一个正在填充。
一些技术细节:
我想弄明白为什么我的一个GPU被填满了,我做错了什么。

这些都是与GPU一起工作的线路,如果我遗漏了什么,您还需要什么,请分享。
我觉得我错过了一些最基本的东西,这不仅会影响到这个模型,而且也会影响到未来的模型,我会非常高兴地得到一些帮助。
非常感谢!
发布于 2018-12-15 19:29:53
在不知道很多细节的情况下,我可以这样说
nvidia-smi不是最可靠和最新的测量机制。DataParallel中的其他GPU)。我对PyTorch还不太了解,无法可靠地回答,但您肯定可以检查单个GPU设置是否可以将批处理大小除以4,或者您是否可以在一次加载模型+批处理(无需处理)。
https://stackoverflow.com/questions/53796254
复制相似问题