文章/答案/技术大牛

发布

社区首页 >问答首页 >不同架构的不同内核

问不同架构的不同内核
EN

Stack Overflow用户

提问于 2014-02-18 20:29:22

回答 2查看 159关注 0票数 7

我想知道是否有一些简单的方法可以为不同的架构提供不同版本的内核。他们是一条简单的路吗？或者唯一的可能是在独立文件中定义独立的内核，并要求nvcc在每个文件中编译不同的体系结构？

cuda

回答 2

Stack Overflow用户

回答已采纳

发布于 2014-02-18 20:55:41

您可以通过编译器指令来实现这一点。有点像

__global__ void kernel(...) {

# if __CUDA_ARCH__ >= 350

    do something

# else

    do something else

# endif

}

票数 8

Stack Overflow用户

发布于 2014-02-19 06:29:22

稍微修改一下C++ JackOLanterns的答案：

template <unsigned int ARCH>
__global__ void kernel(...) 
{
    switch(ARCH)
    {
    case 35:
         do something
         break;
    case 30:
         do something else
         break;
    case 20:
         so something else
         break;
    default:
         do something for all other ARCH
         break;
    }
}

编辑:删除错误@sgar91指出：

您可以通过查询CUDA设备调用带有porperties的内核

cudaGetDeviceProperties(&props, devId);
unsigned int cc = props.major * 10 + props.minor;

switch(cc)
{
case 35:
    kernel<35><<<1, 1>>>(/* args */);
    break;
...
}

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/21864602

复制

相似问题

问不同架构的不同内核
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问不同架构的不同内核EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问不同架构的不同内核
EN