首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >CUBLAS库:查找实际值的最大值,而不是绝对值

CUBLAS库:查找实际值的最大值,而不是绝对值
EN

Stack Overflow用户
提问于 2013-03-13 09:56:21
回答 1查看 1.4K关注 0票数 2

NVIDIA的CUBLAS库允许查找具有最大绝对值(cublasIsamax)的元素/索引。是否可以使用CUBLAS约简函数找到具有最大实际值的元素/索引?

我正在使用CUBLAS版本3.2。

编辑

约束:我不能以任何方式更改生产服务器的状态。这意味着我不能使用推力/cudpp,而且我只能使用一个旧版本的CUBLAS。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2013-03-13 12:06:18

我不知道你指的是什么“削减职能”。

CUBLAS基本上只是CUDA设备BLAS的“同类”实现。它只提供标准的1级、2级和3级BLAS函数,加上三个扩展- geam (缩放矩阵加法/换位)、dgmm (对角化矩阵-矩阵点积)和getrfBatched (许多小矩阵的分批LU分解)。这些函数都不会找到所提供的向量或矩阵的有符号最大值。

NVIDIA提供cudpp推力,其中任何一种可能更适合这类操作。此外,CUBLAS 3.2岁两年半。

最后,我强烈建议使用CUBLAS 4.x或CUBLAS 5.x版本。API和代码的性能有了很大的提高,特别是对于较新的硬件。

票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/15381956

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档