我用SYCL做矩阵乘法,并且有一个工作代码,其中我只使用parallel_for中的,而不是在 parallel_for.中使用nd_range 。谢谢 auto A = A_sycl.get_access<cl::sycl::access::mode::read>(cgh);
auto B = B_sycl.get_access<cl::sycl::a
我不确定的是,如何创建一个cl::sycl::buffer数组并使用std::iota对其进行初始化。下面是我的代码:constexpr size_t n_threads=100;
for (int i=0; i<n_threads; i++) auto ba = a[i].get_access<cl::sycl::access::mode::writestd::i
我刚加了std::cout << "SYCL exception caught: " << e.get_cl_code() << '\n';。* Sample code that illustrates how to make data available on a device ********************************************************************