如果这个问题看起来很基本,我提前道歉,但我是Tensorflow的新手,感谢任何帮助。
我发现我必须频繁地重启计算机才能从keras.applications加载诸如VGG16之类的模型。我有一台相当高端的机器,配备4个Keras GTX1080 Ti GPU和英特尔®酷睿™i7-6850K GeForce @3.60 GTX×12用于我的CPU,并且仅用于Tensorflow (通过Keras)。
一旦我重新启动,我将能够成功地加载模型(如VGG16)并在大型训练数据集上进行训练。但是,如果我让我的计算机闲置一段时间,并重新运行相同的程序,我将得到一个资源耗尽消息(OOM),它可以通过重新启动我的计算机来修复。每隔几个小时就重启我的电脑,这是非常令人沮丧的。有谁知道这是怎么回事以及如何解决这个问题吗?
发布于 2019-02-05 22:18:31
如果批处理大小> 1,请尝试使用较低的批处理大小,这可以降低GPU的内存需求。
此外,如果您结束与网络的工作,检查nvidia-smi的图形处理器内存,如果它是释放的或没有。如果没有,则终止加载网络的进程(通常是一些python解释器)。
https://stackoverflow.com/questions/46919873
复制相似问题