仅供参考,这是我从Nvidia得到的规格
http://www.geforce.com/hardware/desktop-gpus/geforce-gtx-680/specifications
http://www.geforce.com/hardware/desktop-gpus/geforce-gtx-titan/specifications
请注意,内存速度/内存时钟在他们的网站上是相同的,并且都是以Gbps为单位测量的。
谢谢!
发布于 2013-02-25 03:51:54
Titan有384位总线,而GTX 680只有256位,因此内存带宽增加了50% (假设时钟和延迟相同)。
编辑:我将尝试更多地解释整个概念:以下是决定内存性能的因素的简化模型(不仅仅是显卡)。
频率因子A:
RAM以时钟速度运行。以1 GHz的速度运行的RAM每秒“滴答”1,000,000,000 (十亿)次。对于每个滴答,它可以在每个通道上接收或发送一个比特。因此,理论上只有一个内存通道运行在1 1GHz的RAM模块将提供每秒1千兆位,因为字节有8位,这意味着每秒125兆字节。
系数B:“泵速”
DDR-RAM (双倍数据速率)每节拍可以传输两个比特,甚至有“四泵”总线可以每节拍传输四个比特,但我还没有听说在显卡上使用后者。
系数C:总线宽度。
RAM不仅仅有一个单独的通道来发送数据。甚至Intel4004也有4位总线。您链接的图形卡分别具有256条总线车道和384条总线车道。
将上述所有因子相乘,计算出可以发送或接收数据的理论最大值:
**每second=频率的最大吞吐量(字节)* Pumprate * BusWidth /8**
现在让我们计算一下您链接的两个显卡的数学运算。它们似乎都使用相同类型的内存(泵浦速率为2的GDDR5),都以3 GHz的速度运行。
GTX-680: 3 Gbps * 2 * 256 / 8 = 192 GB/s
GTX-Titan: 3 Gbps * 2 * 384 / 8 = 288 GB/s因素D:中的延迟或现实因素
这个系数比以上所有因素的总和要难得多。基本上,当你告诉你的RAM“嘿,我想要这个数据”时,它需要一段时间才能给出答案。这种延迟取决于许多因素,并且很难计算,通常会导致RAM系统提供的性能远低于其理论最大值。这就是所有的计时、预取和大量其他东西都需要考虑的地方。因为不仅仅是数字可以用于营销,更高的数字可以转化为“更好的”,营销的重点主要是其他东西。如果你想知道,这就是GDDR5与你主板上的DDR3的主要不同之处。
发布于 2017-06-29 23:06:23
我认为这里解释了正确的计算:
简而言之:
“(内存时钟x总线宽度/ 8) * GDDR类型乘数=以GB/s为单位的带宽
对于GDDR3,GDDR类型乘数是2,对于GDDR5,是4。“
这里有更多的细节,解释得很好,也很详细。
发布于 2017-07-31 15:58:27
(memory clock in Hz×bus width÷8)×memory clock type multiplier =带宽,单位为MB/s
其中,memory clock type multiplier是下列值之一:
HBM1 / HBM2: 2
GDDR3: 2
GDDR5: 4
GDDR5X: 8
让我们以目前最顶尖的显卡之一GTX1080Ti为例,它使用GDDR5X内存。根据techPowerUp!的说法,此卡的规格为:
内存时钟:1376 Memory
总线宽度:352位
内存类型: GDDR5X
如果我们将这些值插入到上面的公式中,我们得到:
(1376 * 352 / 8) *8= 484 352 MB/s = ~484 GB/s
使用较旧GDDR5内存的GTX 1070也是如此:
内存时钟:2002 Memory
总线宽度:256位
内存类型: GDDR5
(2002 * 256 / 8) *4= 256 256 MB/s = ~256 GB/s
最后,对于使用HBM1的AMD Fury X:
内存时钟:500 Memory
总线宽度:4096位
内存类型: HBM1
(500 * 4096 / 8) *2= 512 000 MB/s = 512 GB/s
以及使用HBM2的Vega 64:
内存时钟:945 Memory
总线宽度:2048位
内存类型: HBM2
(945 * 2048 / 8) *2= 483 840 MB/s = ~484 GB/s
https://stackoverflow.com/questions/15055877
复制相似问题