下午好!我正在学习本教程中的OpenCL C++:点击 (这不是必要的)
该视频使用CL API版本1.2,因此我从答复:https://stackoverflow.com/a/57017982/11968932中的链接下载了OpenCL 1.2报头。
Visual 2022没有显示错误,但程序输出以下符号:
╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠应该说是"Hello World!"。
这是程序本身。主机:
#define CL_USE_DEPRECATED_OPENCL_1_2_APIS
#include <CL/cl.hpp>
#include <iostream>
#include <fstream>
int main()
{
std::vector<cl::Platform> platforms;
cl::Platform::get(&platforms);
auto platform = platforms.front();
std::vector<cl::Device> devices;
platform.getDevices(CL_DEVICE_TYPE_ALL, &devices);
auto device = devices.front();
std::ifstream helloWorldFile("HelloWorld.cl");
std::string src(std::istreambuf_iterator<char>(helloWorldFile), (std::istreambuf_iterator<char>()) );
cl::Program::Sources sources(1, std::make_pair(src.c_str(), src.length() + 1));
cl::Context context(device);
cl::Program program(context, sources);
auto err = program.build("cl-std=CL1.2");
char buf[16];
cl::Buffer memBuf(context, CL_MEM_WRITE_ONLY | CL_MEM_READ_ONLY, sizeof(buf));
cl::Kernel kernel(program, "HelloWorld", &err);
kernel.setArg(0, memBuf);
cl::CommandQueue queue(context, device);
queue.enqueueTask(kernel);
queue.enqueueReadBuffer(memBuf, CL_TRUE, 0, sizeof(buf), buf);
std::cout << buf << " - buf" << std::endl;
}HelloWorld.cl:
_kernel void HelloWorld(_global char* data)
{
data[0] = 'H';
data[1] = 'e';
data[2] = 'l';
data[3] = 'l';
data[4] = 'o';
data[5] = ' ';
data[6] = 'W';
data[7] = 'o';
data[8] = 'r';
data[9] = 'l';
data[10] = 'd';
data[11] = '!';
data[12] = '\n';
}(谢谢;)
发布于 2022-01-30 09:22:14
三个错误:
__kernel,要么是kernel,但不是带一个下划线的_kernel;对于__global也是如此。cl::Buffer memBuf(context, CL_MEM_READ_WRITE, 16*sizeof(buf)); --这里有两件事是错误的:CL_MEM_WRITE_ONLY | CL_MEM_READ_ONLY标志意味着设备端的缓冲区完全不可访问,它只为第一个字符分配内存(忘记了16*sizeof(buf))。queue.enqueueReadBuffer(memBuf, CL_TRUE, 0, 16*sizeof(buf), (void*)buf); -忘了16*sizeof(buf)我也不得不在没有任何争论的情况下做auto err = program.build();。
还请注意:
char buf[16];)限制缓冲区大小。使用堆分配(char* buf = new char[16];)代替(并且不要忘记delete[] buf;)。queue.enqueueTask(kernel);,而是使用queue.enqueueNDRangeKernel(cl_kernel, cl::NullRange, cl::NDRange(...), cl::NDRange(32));。这样,您就可以指定全局和本地范围。最后,做一些广告:我创建了一个OpenCL包装器,以极大地简化学习和使用OpenCL。这个包装器不需要跟踪缓冲区大小,也不需要为CPU和设备提供重复的缓冲区。您需要为HelloWorld示例编写的代码要短得多,而且更容易:
#include "opencl.hpp"
int main() {
const Device device(select_device_with_most_flops()); // compile OpenCL C code for the fastest available device
const uint N = 16u; // size of vectors
Memory<char> buf(device, N); // allocate memory on both host and device
const Kernel HelloWorld(device, N, "HelloWorld", buf); // kernel that runs on the device
HelloWorld.run(); // run add_kernel on the device
buf.read_from_device(); // copy data from device memory to host memory
println(buf.data());
}#include "kernel.hpp" // note: string literals can't be arbitrarily long, so periodically interrupt with )+R(
string opencl_c_container() { return R( // ########################## begin of OpenCL C code ####################################################################
kernel void HelloWorld(global char* data) {
data[0] = 'H';
data[1] = 'e';
data[2] = 'l';
data[3] = 'l';
data[4] = 'o';
data[5] = 32; // spaces are wrongly converted with stringification macro, so use ascii code here instead of ' '
data[6] = 'W';
data[7] = 'o';
data[8] = 'r';
data[9] = 'l';
data[10] = 'd';
data[11] = '!';
data[12] = '\n';
}
);} // ############################################################### end of OpenCL C code #####################################################################https://stackoverflow.com/questions/70906254
复制相似问题