文章/答案/技术大牛

发布

社区首页 >问答首页 >Google : cuDNN错误: CUDNN_STATUS_NOT_INITIALIZED

问Google : cuDNN错误: CUDNN_STATUS_NOT_INITIALIZED
EN

Stack Overflow用户

提问于 2019-12-03 14:35:04

回答 1查看 6.6K关注 0票数 5

昨天和今天运行与过去几个月相同的Python记事本，我得到了错误。

/usr/local/lib/python3.6/dist-packages/torch/autograd/__init__.py in backward(tensors, grad_tensors, retain_graph, create_graph, grad_variables)
 97     Variable._execution_engine.run_backward(
 98         tensors, grad_tensors, retain_graph, create_graph,
 ---> 99         allow_unreachable=True)  # allow_unreachable flag
100 
101 

RuntimeError: cuDNN error: CUDNN_STATUS_NOT_INITIALIZED

在代码中，这个错误似乎是随机的，因为它改变了尝试。据我所搜索，这似乎是一个兼容性问题。

另外，如果我重新运行这个单元格，我可能会得到另一个错误，

/usr/local/lib/python3.6/dist-packages/torch/utils/data/dataloader.py in __next__(self)
346         data = self._dataset_fetcher.fetch(index)  # may raise StopIteration
347         if self._pin_memory:
--> 348             data = _utils.pin_memory.pin_memory(data)
349         return data
350 

/usr/local/lib/python3.6/dist-packages/torch/utils/data/_utils/pin_memory.py in pin_memory(data)
 53         return type(data)(*(pin_memory(sample) for sample in data))
 54     elif isinstance(data, container_abcs.Sequence):
 ---> 55         return [pin_memory(sample) for sample in data]
 56     elif hasattr(data, "pin_memory"):
 57         return data.pin_memory()

 /usr/local/lib/python3.6/dist-packages/torch/utils/data/_utils/pin_memory.py in <listcomp>(.0)
 53         return type(data)(*(pin_memory(sample) for sample in data))
 54     elif isinstance(data, container_abcs.Sequence):
 ---> 55         return [pin_memory(sample) for sample in data]
 56     elif hasattr(data, "pin_memory"):
 57         return data.pin_memory()

 /usr/local/lib/python3.6/dist-packages/torch/utils/data/_utils /pin_memory.py in pin_memory(data)
 45 def pin_memory(data):
 46     if isinstance(data, torch.Tensor):
 ---> 47         return data.pin_memory()
 48     elif isinstance(data, string_classes):
 49         return data

 RuntimeError: cuda runtime error (700) : an illegal memory access was encountered at /pytorch/aten/src/THC/THCCachingHostAllocator.cpp:278

其他人也有同样的问题吗？有人解决了吗，怎么解决的？

python

google-colaboratory

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-12-07 18:24:19

最后，我解决了这个问题。

在我的代码中的某个地方，

使用了一个带有ignore_index参数的CrossEntropyLoss函数作为ignore_index = my_ignore_index。错误地，我将my_ignore_index = -1作为值，它不是我的数据的有效值；-1从未出现在我的数据值中。更新正确地解决了这个问题。这解决了“.非法的内存访问.”错误.

我所做并帮助解决问题的另一件事是使用新版本的anaconda3。这解决了CUDNN_STATUS_NOT_INITIALIZED错误.

我希望这能帮上忙。

票数 3

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/59159441

复制

相似问题

问Google : cuDNN错误: CUDNN_STATUS_NOT_INITIALIZED
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Google : cuDNN错误: CUDNN_STATUS_NOT_INITIALIZEDEN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Google : cuDNN错误: CUDNN_STATUS_NOT_INITIALIZED
EN