cublas如何处理NaNs?当操作具有IEEE754定义的NaNs行为时,cublas函数是否总是以这种方式处理NaNs?我特别感兴趣的是他们如何在他们的gemm和批处理gemm例程中处理NaNs,据我测试,使用NaNs的结果是符合标准的,但是在cuda文档中没有提到这一点,所以我对此有点不确定,正确地处理NaNs对我的代码的正确性至关重要。
发布于 2015-10-31 22:41:38
CUDA GPU应遵循IEEE-754浮点运算规则。
不应该存在对NaN的非标准处理。这应该适用于所有使用浮点算法的库,并且不应该因函数而异。
This document对GPU使用IEEE754浮点算法进行了大量的讨论。
https://stackoverflow.com/questions/33449744
复制相似问题