在CUDA中,clock()和clock64()测量的时钟是多少?
根据CUDA documentation的说法,时钟是“每个多处理器的计数器”。根据我的理解,这指的是主GPU时钟(不是着色器时钟)。
但是,当我使用主GPU时钟频率测量时钟计数并将其转换为时间值时,我得到的结果是实际值的两倍(我使用cuda事件使用主机代码的内核执行时间来测量实际值)。这表明clock()返回着色器时钟频率,而不是主GPU时钟。
我怎样才能解决这个困惑呢?
编辑:我通过将从cudaGetDeviceProperties获得的时钟频率除以2来计算主图形处理器时钟频率。据我所知,cudaGetDeviceProperties给出的值是着色器时钟频率。
发布于 2014-11-22 01:37:41
确实,CUDA documentation说clock()和clock64()返回“每个多处理器的计数器”。但在费米架构中,clock()和clock64()实际上返回的是着色器时钟计数器。
cudaGetDeviceProperties返回的clockRate是着色器时钟频率。
因此,为了计算时间,我们必须将来自clock()或clock64()的时钟计数除以从cudaGetDeviceProperties获得的着色器时钟频率。
https://stackoverflow.com/questions/27065862
复制相似问题