我正在研究一种可能的基于gpu的万亿次浮点计算机器...要使用的基准将是LINPACK,现在问题来了;通过linpack文档,它说它是以全精度计算的,而不是以双精度计算的,对于某些机器来说,全精度可以是单精度。有没有人可以解释一下其中的区别,因为这将决定我应该选择GTX 590还是Tesla 2070。
发布于 2011-09-12 12:33:02
我认为选择“全精度”一词是为了涵盖IEEE-754双精度(这就是在提到的GPU上使用的)和旧Cray矢量计算机的“单精度”格式,后者支持1个符号位、15个指数位和48个尾数位,提供了更大的范围,但精度略低于IEEE-754双精度。以下是Cray-1上使用的浮点格式的文档:
http://ed-thelen.org/comp-hist/CRAY-1-HardRefMan/CRAY-1-HRM.html#p3-20
发布于 2011-09-11 00:15:42
关于nVidia官方的HPL 0.8版(这是我们用来对混合机器进行基准测试的):
它只能在特斯拉上运行(只有当你的图形处理器内存超过2 GiB时才能运行,据我所知,只有特斯拉才能运行)
它使用双精度,这是使用Teslas的另一个要点,因为双运算性能在主流GPU上是有限的。
顺便说一句:在6节点机器(每个节点2个GPU)上实现至少50%的效率被认为是几乎不可能的。
https://stackoverflow.com/questions/7372877
复制相似问题