假设我有一个分布式系统,它有36个节点,每个节点有36个核心,现在我使用英特尔的dgemm函数进行乘法,我想使用所有的核心( 36 * 36 ),我怎么能做到呢?
发布于 2022-03-11 12:57:42
默认情况下,如果您在多核CPU上运行,英特尔oneMKL将使用所有可用的内核。通过设置MKL_VERBOSE=1,您可以看到告诉我们正在使用多少核的信息。我们有一个选项-qmkl=cluster,它告诉编译器(英特尔编译器)使用集群特定的库和oneMKL中的顺序库进行链接。有关更多细节,请查看下面的链接。https://www.intel.com/content/www/us/en/develop/documentation/onemkl-linux-developer-guide/top/working-with-onemkl-cluster-software/examples-of-linking-for-clusters/examples-for-linking-a-c-application.html
https://stackoverflow.com/questions/71333679
复制相似问题