首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何通过内存时钟/内存速度获取内存带宽

如何通过内存时钟/内存速度获取内存带宽
EN

Stack Overflow用户
提问于 2013-02-25 03:49:18
回答 3查看 38.6K关注 0票数 9

仅供参考,这是我从Nvidia得到的规格

http://www.geforce.com/hardware/desktop-gpus/geforce-gtx-680/specifications

http://www.geforce.com/hardware/desktop-gpus/geforce-gtx-titan/specifications

请注意,内存速度/内存时钟在他们的网站上是相同的,并且都是以Gbps为单位测量的。

谢谢!

EN

回答 3

Stack Overflow用户

回答已采纳

发布于 2013-02-25 03:51:54

Titan有384位总线,而GTX 680只有256位,因此内存带宽增加了50% (假设时钟和延迟相同)。

编辑:我将尝试更多地解释整个概念:以下是决定内存性能的因素的简化模型(不仅仅是显卡)。

频率因子A:

RAM以时钟速度运行。以1 GHz的速度运行的RAM每秒“滴答”1,000,000,000 (十亿)次。对于每个滴答,它可以在每个通道上接收或发送一个比特。因此,理论上只有一个内存通道运行在1 1GHz的RAM模块将提供每秒1千兆位,因为字节有8位,这意味着每秒125兆字节。

系数B:“泵速”

DDR-RAM (双倍数据速率)每节拍可以传输两个比特,甚至有“四泵”总线可以每节拍传输四个比特,但我还没有听说在显卡上使用后者。

系数C:总线宽度。

RAM不仅仅有一个单独的通道来发送数据。甚至Intel4004也有4位总线。您链接的图形卡分别具有256条总线车道和384条总线车道。

将上述所有因子相乘,计算出可以发送或接收数据的理论最大值:

**每second=频率的最大吞吐量(字节)* Pumprate * BusWidth /8**

现在让我们计算一下您链接的两个显卡的数学运算。它们似乎都使用相同类型的内存(泵浦速率为2的GDDR5),都以3 GHz的速度运行。

代码语言:javascript
复制
GTX-680: 3 Gbps * 2 * 256 / 8 = 192 GB/s

GTX-Titan: 3 Gbps * 2 * 384 / 8 = 288 GB/s

因素D:中的延迟或现实因素

这个系数比以上所有因素的总和要难得多。基本上,当你告诉你的RAM“嘿,我想要这个数据”时,它需要一段时间才能给出答案。这种延迟取决于许多因素,并且很难计算,通常会导致RAM系统提供的性能远低于其理论最大值。这就是所有的计时、预取和大量其他东西都需要考虑的地方。因为不仅仅是数字可以用于营销,更高的数字可以转化为“更好的”,营销的重点主要是其他东西。如果你想知道,这就是GDDR5与你主板上的DDR3的主要不同之处。

票数 24
EN

Stack Overflow用户

发布于 2017-06-29 23:06:23

我认为这里解释了正确的计算:

https://www.goldfries.com/computing/gddr3-vs-gddr5-graphic-card-comparison-see-the-difference-with-the-amd-radeon-hd-7750/

简而言之:

“(内存时钟x总线宽度/ 8) * GDDR类型乘数=以GB/s为单位的带宽

对于GDDR3,GDDR类型乘数是2,对于GDDR5,是4。“

这里有更多的细节,解释得很好,也很详细。

票数 0
EN

Stack Overflow用户

发布于 2017-07-31 15:58:27

来自https://www.goldfries.com/computing/gddr3-vs-gddr5-graphic-card-comparison-see-the-difference-with-the-amd-radeon-hd-7750/

(memory clock in Hz×bus width÷8)×memory clock type multiplier =带宽,单位为MB/s

其中,memory clock type multiplier是下列值之一:

HBM1 / HBM2: 2

GDDR3: 2

GDDR5: 4

GDDR5X: 8

让我们以目前最顶尖的显卡之一GTX1080Ti为例,它使用GDDR5X内存。根据techPowerUp!的说法,此卡的规格为:

内存时钟:1376 Memory

总线宽度:352位

内存类型: GDDR5X

如果我们将这些值插入到上面的公式中,我们得到:

(1376 * 352 / 8) *8= 484 352 MB/s = ~484 GB/s

使用较旧GDDR5内存的GTX 1070也是如此:

内存时钟:2002 Memory

总线宽度:256位

内存类型: GDDR5

(2002 * 256 / 8) *4= 256 256 MB/s = ~256 GB/s

最后,对于使用HBM1的AMD Fury X:

内存时钟:500 Memory

总线宽度:4096位

内存类型: HBM1

(500 * 4096 / 8) *2= 512 000 MB/s = 512 GB/s

以及使用HBM2的Vega 64

内存时钟:945 Memory

总线宽度:2048位

内存类型: HBM2

(945 * 2048 / 8) *2= 483 840 MB/s = ~484 GB/s

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/15055877

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档