文章/答案/技术大牛

发布

社区首页 >问答首页 >如何调试tensorflow2-gpu中的内存不足

问如何调试tensorflow2-gpu中的内存不足
EN

Stack Overflow用户

提问于 2020-03-30 23:19:07

回答 1查看 470关注 0票数 5

我使用的是带有tf.data.Dataset的tensorflow-2图形处理器。在小模型上进行训练是可行的。

当训练一个更大的模型时，首先，一切都可以正常工作:使用gpu，第一个时期工作没有问题(但我使用了大部分gpu内存)。

在验证时，我遇到了一个具有各种分配的CUDA_ERROR_OUT_OF_MEMORY，其中不能分配的字节越来越少(从922Mb到337Mb)。我目前没有指标，也没有回调，正在使用tf.keras.Model.fit。如果我删除验证数据，训练将继续。

我的问题是什么？我如何调试它呢？

在tf1中，我可以使用RunOptions(report_tensor_allocations_upon_oom=True)，那么在tf2中有没有类似的东西？

这发生在tensorflow==2.1.0上。

python

gpu

tensorflow2.x

回答 1

Stack Overflow用户

发布于 2020-03-30 23:57:52

这在2.0 alpha TensorFlow中没有发生，但在2.0中发生了。

Pip安装tensorflow-gpu==2.0.0:内存泄漏！

Pip install tensorflow-gpu==2.0.0-alpha:没问题！

试试看

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/60933768

复制

相似问题

问如何调试tensorflow2-gpu中的内存不足
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何调试tensorflow2-gpu中的内存不足EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何调试tensorflow2-gpu中的内存不足
EN