我建立了一个神经网络,它需要使用Cholesky分解和解三角系统作为计算的一部分。这意味着我也需要计算整个计算的梯度,当然。
当我试图编译代码时,我会得到错误“没有Cula可用”。不幸的是,我无法从网站下载Cula。
我想知道是否有可能将CPU和GPU与theano混合使用。我需要使用Cholesky并解决的矩阵很小(100x100),所以我可以在CPU上完成这个部分。但是,要做到这一点,我需要在GPU计算矩阵之后立即将矩阵传输到CPU,然后将结果发送回GPU。能透明地做到这一点吗?
发布于 2016-11-10 16:00:18
这种转移是透明的。没必要做什么特别的事。但我会再次建议你分析一下西亚诺图,这是肯定的:http://deeplearning.net/software/theano/tutorial/profiling.html#tut-profiling
对于cula,有一个基于NVIDIA提供的缓冲器的解决方案的PR。所以这可能不再需要了。试试这个PR:https://github.com/Theano/Theano/pull/4917
https://stackoverflow.com/questions/40487105
复制相似问题