使用ECC运行CUDA设备的性能成本是多少?GPU的峰值性能通常在ECC上引用,如何找出ECC的理论极限是什么?
为了这个问题而编辑,假设我有一个完全绑定内存的内核,它只是简单地移动数据。任何算法都与运行时间无关,因为可以在内存单元繁忙时对其进行调度。在ECC关闭后,理论上,我可以获得设备规范中引用的峰值内存带宽。我在ECC上能得到什么峰值?
谢谢!
发布于 2014-05-02 18:18:14
除了对这个问题的有益评论外,我还引用了尼古拉斯·威尔特的书“数据自动化系统手册”中5.2.13节的相关部分:纠错码。你可能会发现它们很有帮助。
为了换取更少的内存(因为一些内存用于记录一些冗余)和更低的带宽,启用ECC的GPU可以静默地纠正单比特错误并报告双比特错误。 ECC具有以下特点: -减少了12.5%的可用内存。 -它使上下文同步变得更昂贵。 -启用ECC时,未合并的内存事务比其他事务更昂贵。
https://stackoverflow.com/questions/23432834
复制相似问题