首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >NVIDIA Tesla中的单精度和双精度之间有关系吗?

NVIDIA Tesla中的单精度和双精度之间有关系吗?
EN

Stack Overflow用户
提问于 2014-09-03 20:41:28
回答 1查看 1.3K关注 0票数 0

在特斯拉K20模型中,峰值单精度浮点性能约为3.52 TFlops,双精度为1.17 TFlops,比值为3。特斯拉K20X为3.95和1.31,特斯拉K40为4.29和1.43 TFlops,这一比例似乎在重复。我的问题是,如果这个比率是3而不是2的话,这对我来说是合乎逻辑的,因为单精度和双精度之间的区别是合理的。我正在学习GPUS和GPUS,所以我对它不太了解。

在这个pdf的第二页中有一个规范表。NVIDIA-Tesla-Kepler-Family-Datasheet.pdf

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2014-11-22 02:49:53

你列出的模型都是基于开普勒结构的,它的峰值双精度率等于峰值单精度率的1/3。这就是NVIDIA制造这款硬件的方式。相比较而言,费米( Fermi )是前一代硬件,峰值双精度率与单精度比为1/2。

按指令类型和硬件生成,您可以参考NVIDIA的指令吞吐量文档:

http://docs.nvidia.com/cuda/cuda-c-programming-guide/index.html#maximize-instruction-throughput

您会注意到,消费者级产品(GeForce GTX)通常有更低的双到单精度率- 1/8,1/12,1/24,甚至1/32,取决于硬件版本。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/25653264

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档