我有一个非常简单的内核,它应该对一些输入做出一些决定。输入为float4类型,而bit_decision为uchar4类型。在我的AMD卡上,我得到了一个编译错误:
用于保存值太小的数据结构类型的
大小
错误: HSAIL计划尚未成功完成。
Codegen阶段编译失败。
错误:禁闭性终结到ISA失败。
__kernel void hard_decision(__global const float4 *input,
__global uchar4 *bit_decision,
uchar4 zero,
uchar4 one)
{
bit_decision[get_global_id(0)] = select(zero, one, input[get_global_id(0)]<0);
}你知道密码有什么问题吗?
发布于 2020-04-17 15:30:42
在我添加convert_uchar4(.)之后不再出现编译错误。似乎select(a,b,条件)函数中的参数允许必须与a和b具有相同的类型。我还将条件部分中的0改为(float4)(0,0,0,0)。
__kernel void hard_decision(__global const float4 *input,
__global uchar4 *bit_decision,
uchar4 zero,
uchar4 one)
{
bit_decision[get_global_id(0)] = select(zero, one, convert_uchar4(input[get_global_id(0)]<(float4)(0,0,0,0)));
}https://stackoverflow.com/questions/61274605
复制相似问题