我有一个关于CUDA Fermi's architecture的问题:我在某个地方读到过,在Fermi's architecture中,全局内存的访问速度与共享内存一样快,因为它们现在使用统一寻址。
因此,我真的可以访问全局内存上的数据而不会有(大)延迟(不像“预费米”GPU)?
对我来说,知道这一点非常重要,因为我正在为Nvidia Tesla GPU编程,但没有它(它在大学的实验室里,我在夏天不能访问它……)
发布于 2012-08-12 06:47:43
这不是真的。与共享内存访问相比,Fermi上的全局内存访问相对较长。但是,由于存在缓存,您可能会直接命中缓存,从而降低延迟。这在不太理想的存储器访问模式(例如,略微未对齐的访问)中特别有用。
统一内存寻址是完全不同的事情,与上面的内容无关。统一内存寻址允许GPU在运行时推断给定的内存指针是否指向全局或共享(甚至是映射固定主机或其他GPU)内存。在预费米卡上,内存类型必须在编译时是可推断的。
https://stackoverflow.com/questions/11916382
复制相似问题