文章/答案/技术大牛

发布

社区首页 >问答首页 >CUDA Fermi的架构:内存结构

问CUDA Fermi的架构:内存结构
EN

Stack Overflow用户

提问于 2012-08-12 02:06:16

回答 1查看 205关注 0票数 0

我有一个关于CUDA Fermi's architecture的问题:我在某个地方读到过，在Fermi's architecture中，全局内存的访问速度与共享内存一样快，因为它们现在使用统一寻址。

因此，我真的可以访问全局内存上的数据而不会有(大)延迟(不像“预费米”GPU)？

对我来说，知道这一点非常重要，因为我正在为Nvidia Tesla GPU编程，但没有它(它在大学的实验室里，我在夏天不能访问它……)

发布于 2012-08-12 06:47:43

这不是真的。与共享内存访问相比，Fermi上的全局内存访问相对较长。但是，由于存在缓存，您可能会直接命中缓存，从而降低延迟。这在不太理想的存储器访问模式(例如，略微未对齐的访问)中特别有用。

统一内存寻址是完全不同的事情，与上面的内容无关。统一内存寻址允许GPU在运行时推断给定的内存指针是否指向全局或共享(甚至是映射固定主机或其他GPU)内存。在预费米卡上，内存类型必须在编译时是可推断的。

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/11916382

复制

相似问题

问CUDA Fermi的架构:内存结构EN