是否有可能使用迭代器与幼崽一样的推力?我不想用幼崽代替推力,如下所示:
__global__ void reduce_roster(thrust::device_vector<float>::iterator vect, float * tab_seq, int SEUIL_ROSTER)
{
int tid = blockIdx.x * blockDim.x + threadIdx.x;
float resultat = 0;
int i = TAILLE_ROSTER/TAILLE_SEQ_ROSTER;
resultat = thrust::reduce(thrust::device, vect + (tid * TAILLE_ROSTER) + TAILLE_SEQ_ROSTER * (i - 1), vect + (tid * TAILLE_ROSTER) + TAILLE_SEQ_ROSTER * i);
float tmp;
i--;
while (resultat != -1 && i != 0)
{
if (resultat > SEUIL_ROSTER)
{
resultat = -1;
}
else
{
tmp = thrust::reduce(thrust::device, vect + (tid * TAILLE_ROSTER) + TAILLE_SEQ_ROSTER * (i - 1), vect + (tid * TAILLE_ROSTER) + TAILLE_SEQ_ROSTER * i);
resultat = resultat + tmp;
i--;
}
}因为CUB比信任更快,所以我尝试使用它来减少数组的片段。
发布于 2018-10-10 08:49:12
不是的。
此外,也不可能使用CUB执行与代码中显示的操作相同的操作。根据编译内核的方式,推力将发出由每个线程依次执行还原的代码,或者由使用动态并行的子内核启动来执行。另一方面,CUB具有翘曲和阻塞范围的设备缩小功能。它不支持单线程或动态并行范围操作。
https://stackoverflow.com/questions/52729021
复制相似问题