我正在学习oneapi,当我使用dpcpp并行版本时,当我尝试执行exclusive_scan时,我会得到错误的结果。
它总是假定第一个元素为零。
代码:
#include <CL/sycl.hpp>
#include <oneapi/dpl/execution>
#include <oneapi/dpl/numeric>
#include <oneapi/dpl/iterator>
#include <iostream>
#include <vector>
int main(){
sycl::queue Q(sycl::cpu_selector{});
const u_int32_t n = 100;
std::vector<u_int32_t> data(n,1);
{
sycl::buffer b_data(data);
auto policy = oneapi::dpl::execution::make_device_policy<class mypolicy>(Q);
oneapi::dpl::exclusive_scan(
policy,
oneapi::dpl::begin(b_data),
oneapi::dpl::end(b_data),
oneapi::dpl::begin(b_data),
0);
}
for(auto i=0; i<10 ; i++){
std::cout << data[i] << std::endl;
}
}输出:
0
0
1
2
3
4
5
6
7
8预期产出:
0
1
2
3
4
5
6
7
8
9构建命令:dpcpp -Wall main.cpp -o main
发布于 2022-03-03 12:44:30
这是一个已知的限制,如下面的链接所述:https://www.intel.com/content/www/us/en/develop/documentation/oneapi-dpcpp-library-guide/top/intel-oneapi-dpc-library-onedpl-overview.html
对于一元操作,建议使用初始值为1而不是0。
oneapi::dpl::exclusive_scan(
policy,
oneapi::dpl::begin(b_data),
oneapi::dpl::end(b_data),
oneapi::dpl::begin(b_data),
1);谢谢和问候,Hemanth。
https://stackoverflow.com/questions/71283790
复制相似问题