我一直在努力加速用OpenCL编写的一些图像处理代码,我发现对于我的内核来说,缓冲区(cl_mem)比图像(cl_image)要快得多。
因此,我想以cl_mem的形式处理我的图像,但不幸的是,我只能使用一个只喷出cl_images的API。我正在使用OS clCreateImageFromIOSurface2DAPPLE,它为我创建了一个映像。
有没有办法服用cl_image并将其作为cl_mem对待?当我尝试这样做时,在运行我的内核时会出现一个错误。
我尝试过使用clEnqueueCopyImageToBuffer将映像复制到缓冲区,但这也太慢了。有什么想法吗?提前感谢
PS:我相信我的内核在缓冲区上运行的速度要快得多,因为我可以做一个vload4,每次加载4个像素,而read_imagei只加载一个像素。
发布于 2015-11-28 14:46:05
不能将OpenCL映像视为内存。图像的内存布局对于实现来说是私有的,应该被认为是未知的。
但是,如果代码创建映像,则可以创建缓冲区,然后使用cl_khr_image2d_from_buffer。否则,编写一个内核,将数据从图像复制到缓冲区,并查看它是否比clEnqueueCopyImageToBuffer快(不太可能)。
https://stackoverflow.com/questions/33908871
复制相似问题