首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在GPU上计算特征值和特征向量性能较差

在GPU上计算特征值和特征向量性能较差
EN

Stack Overflow用户
提问于 2012-03-17 02:47:03
回答 2查看 2.8K关注 0票数 6

在一些代码中,我们需要得到具有对称实矩阵的广义特征值问题(Ax=lamba Bx)的自向量和自值。此代码使用LACPACK中的DSPGVX。我们想在GPU上使用MAGMA函数来加速。我们在这个论坛上问了这个问题,得到了答案。

http://icl.cs.utk.edu/magma/docs/zhegvx_8cpp.html

我们矩阵的大小(N)从100到50000,甚至更多,与分子中的原子数量有关。我们观察到:

a)对于大于2500 (大约)的N,岩浆不起作用;分段断层b)岩浆运行总是比LAPACK序列慢,大约慢10倍

这种行为正常吗?我们能克服它吗?有人可以报告任何参考资料,任何人在类似的问题上工作的人得到了像样的加速?

谢谢

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2012-03-20 17:46:55

根据我的经验,您可以通过切换到更好的eigensolver来获得更大的性能优势。据我所知,最好的求解器是ARPACK。你将获得最大的好处,因为你的矩阵有一定的结构,例如,如果它们是稀疏的。如果您只需要提取特征对总数的一小部分,则此求解器也是最有效的。

首先,我会尝试使用这个解算器来解决仅在CPU上运行的问题。您可能会发现,仅此一项就足以满足您的需求。如果不是,那么将ARPACK的计算核心移动到GPU是相对容易的。或者,可以使用ARPACK的并行版本。

票数 4
EN

Stack Overflow用户

发布于 2012-03-22 11:16:54

你有没有试过CULA http://www.culatools.com/?NVIDIA将CULA转换为CUDA,因此至少在理论上,它应该是解决广义特征值问题的最佳实现之一。我认为单精度版本是免费的,所以你可以试一试。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/9742864

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档