NVIDIA的CUBLAS库允许查找具有最大绝对值(cublasIsamax)的元素/索引。是否可以使用CUBLAS约简函数找到具有最大实际值的元素/索引?
我正在使用CUBLAS版本3.2。
编辑
约束:我不能以任何方式更改生产服务器的状态。这意味着我不能使用推力/cudpp,而且我只能使用一个旧版本的CUBLAS。
发布于 2013-03-13 12:06:18
我不知道你指的是什么“削减职能”。
CUBLAS基本上只是CUDA设备BLAS的“同类”实现。它只提供标准的1级、2级和3级BLAS函数,加上三个扩展- geam (缩放矩阵加法/换位)、dgmm (对角化矩阵-矩阵点积)和getrfBatched (许多小矩阵的分批LU分解)。这些函数都不会找到所提供的向量或矩阵的有符号最大值。
NVIDIA提供cudpp和推力,其中任何一种可能更适合这类操作。此外,CUBLAS 3.2岁两年半。
最后,我强烈建议使用CUBLAS 4.x或CUBLAS 5.x版本。API和代码的性能有了很大的提高,特别是对于较新的硬件。
https://stackoverflow.com/questions/15381956
相似问题