我刚开始使用OpenMP,我刚刚用gcc -fopenmp openmp_c_helloworld.c编译了以下代码:
#include <omp.h>
#include <stdio.h>
#include <stdlib.h>
int main (int argc, char *argv[]) {
int th_id, nthreads;
#pragma omp parallel private(th_id)
{
th_id = omp_get_thread_num();
printf("Hello World from thread %d\n", th_id);
#pragma omp barrier
if ( th_id == 0 ) {
nthreads = omp_get_num_threads();
printf("There are %d threads\n",nthreads);
}
}
return EXIT_SUCCESS;
}我只是在带有HyperThreading的四核英特尔CPU上运行该可执行文件,并获得以下输出:
Hello World from thread 2
Hello World from thread 0
Hello World from thread 3
Hello World from thread 1
There are 4 threads从技术上讲,我的CPU上有8个线程和4个CPU-core,为什么OpenMP只显示4个线程?
发布于 2011-12-03 16:05:11
简单地说,我认为这是因为OpenMP查找的是CPU(核心)的数量,而不是处理器线程的数量。查看this页面:`
实现默认值-通常是节点上的CPU数量,但也可以是动态的(参见下一个项目符号)。
您可以尝试将程序中的线程数设置为与处理器线程数相等,看看是否有性能改进(您必须创建自己的基准测试程序)。在并行编程中,当工作线程的数量等于处理器线程的数量时,可以获得良好的性能。您还可以为I/O保留一两个额外的线程。
https://stackoverflow.com/questions/8368686
复制相似问题