我正在学习并行编程,并试图将合并并行化,这样线程的数量就等于递归的级别。将数组划分为8个子数组,并对每个子数组使用每个线程。我不想使用线程。我正在张贴顺序代码。请告诉我如何使用#杂注命令并并行化algo的步骤。
#include <stdlib.h>
#include "omp.h"
void mergesort(int a[],int i,int j);
void merge(int a[],int i1,int j1,int i2,int j2);
int main()
{
int *a, num, i;
scanf("%d",&num);
a = (int *)malloc(sizeof(int) * num);
for(i=0;i<num;i++)
scanf("%d",&a[i]);
mergesort(a, 0, num-1);
printf("\nSorted array :\n");
for(i=0;i<num;i++)
printf("%d ",a[i]);
return 0;
}
void mergesort(int a[],int i,int j)
{
int mid;
int tid;
if(i<j)
{
mid=(i+j)/2;
//tid=omp_get_thread_num;
#pragma omp parallel sections
ct=omp_get_num_threads(3);
{
//printf("%d",tid);
#pragma omp section
{
mergesort(a,i,mid); //left recursion
}
#pragma omp section
{
mergesort(a,mid+1,j); //right recursion
}
}
merge(a,i,mid,mid+1,j); //merging of two sorted sub-arrays
}
}
void merge(int a[],int i1,int j1,int i2,int j2)
{
int temp[1000]; //array used for merging
int i,j,k;
i=i1; //beginning of the first list
j=i2; //beginning of the second list
k=0;
while(i<=j1 && j<=j2) //while elements in both lists
{
if(a[i]<a[j])
temp[k++]=a[i++];
else
temp[k++]=a[j++];
}
while(i<=j1) //copy remaining elements of the first list
temp[k++]=a[i++];
while(j<=j2) //copy remaining elements of the second list
temp[k++]=a[j++];
//Transfer elements from temp[] back to a[]
for(i=i1,j=0;i<=j2;i++,j++)
a[i]=temp[j];
}发布于 2021-12-05 13:01:14
首先,主要移动#pragma omp parallel,因为不能嵌套多个并行部分(为了性能考虑,因为它将为每个线程创建一个新的并行部分)。
然后,不要使用sections/section,因为这样做不是为了这样的使用。使用任务代替。任务可以递归提交,就像您想要做的那样。您可以使用taskwait (通常在合并之前)等待执行任务。
由于任务很昂贵,所以您应该考虑不要创建太多的任务。可以控制要创建任务或不使用if子句。
不要忘记释放主函数中分配的数据。
https://stackoverflow.com/questions/70231561
复制相似问题