文章/答案/技术大牛

发布

社区首页 >问答首页 >为BLAS 2

问为BLAS 2
EN

Stack Overflow用户

提问于 2012-01-05 17:24:39

回答 1查看 718关注 0票数 0

我有一个应用程序，我需要执行许多规范，点积，最重要的是，矩阵向量乘法。

矩阵和向量是巨大的。矩阵尺寸趋向于100000x100000。

环路结构是：

while(condition)
/* usually iterations=dimension of matrix, so around 1 million iterations are *at least* required (if not more) */
matrix-vector multiplication
3 dot prods
2 norms

我目前正在使用英特尔Fortran与英特尔MKL。用Intel MKL重写我在Intel C中的代码有帮助吗？是否有人执行过任何类型的基准(特别是DGEMV )？重写代码是一个很大的痛苦，但我不介意重写，因为我看到了一个理由。

编辑:我说错了:矩阵尺寸是100000，不是一百万。相当严重的错误：\x

是的，矩阵是稠密的，它需要密度。而且，它不是对称的，甚至不是正定的。我的算法是QMR的一个改进版本。

fortran

linear-algebra

lapack

supercomputers

回答 1

Stack Overflow用户

回答已采纳

发布于 2012-01-05 17:29:46

在C或Fortran中，性能将完全相同，因为支持库调用的实际实现是相同的，代码中的所有时间基本上都花在这些库调用上。

票数 9

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/8746813

复制

相似问题

问为BLAS 2
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问为BLAS 2EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问为BLAS 2
EN