我已经成功地使用了 Armadillo 和OpenBLAS,在Ubuntu14.0464位的硕士论文中(安装了Armadillo,也没有安装)。性能令人印象深刻--我的代码主要来自基本的矩阵操作。所有这些都是使用所有可用的线程执行的。
现在,我尝试在Visual 2013中在OpenBLAS Windows 7 64位计算机上使用Armadillo和。我在网上找到了一些帮助,并成功地添加了PThread库。代码本身可以工作,但是性能很差。我用1000 x 1000矩阵测试了三种基本运算-加法、乘法和单元乘法.在这三个中,只有经典乘法使用所有的CPU能力。另外两个使用25%的CPU,这表明它们运行在单线程上。
在Ubuntu的情况下,我没有掩盖这种行为。有人有什么建议吗?我没有看到任何联系,那里有人有类似的问题。
发布于 2015-10-16 10:51:52
您确定OpenBLAS使用Ubuntu上的多个线程进行加法和元素级乘法吗?从直觉上说,我希望那些操作是BW限制的,而不是FPU限制的,所以我猜多线程不会有多大帮助?
https://stackoverflow.com/questions/33168616
复制相似问题