首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >CUDA Fermi的架构:内存结构

CUDA Fermi的架构:内存结构
EN

Stack Overflow用户
提问于 2012-08-12 02:06:16
回答 1查看 205关注 0票数 0

我有一个关于CUDA Fermi's architecture的问题:我在某个地方读到过,在Fermi's architecture中,全局内存的访问速度与共享内存一样快,因为它们现在使用统一寻址。

因此,我真的可以访问全局内存上的数据而不会有(大)延迟(不像“预费米”GPU)?

对我来说,知道这一点非常重要,因为我正在为Nvidia Tesla GPU编程,但没有它(它在大学的实验室里,我在夏天不能访问它……)

EN

回答 1

Stack Overflow用户

发布于 2012-08-12 06:47:43

这不是真的。与共享内存访问相比,Fermi上的全局内存访问相对较长。但是,由于存在缓存,您可能会直接命中缓存,从而降低延迟。这在不太理想的存储器访问模式(例如,略微未对齐的访问)中特别有用。

统一内存寻址是完全不同的事情,与上面的内容无关。统一内存寻址允许GPU在运行时推断给定的内存指针是否指向全局或共享(甚至是映射固定主机或其他GPU)内存。在预费米卡上,内存类型必须在编译时是可推断的。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/11916382

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档