首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >计算视觉轮廓器中的CUDA memset

计算视觉轮廓器中的CUDA memset
EN

Stack Overflow用户
提问于 2012-03-10 17:24:35
回答 1查看 382关注 0票数 0

我使用来测量我的CUDA程序的性能。

分析器的结果显示了cudaMemset函数的两个不同的结果。

  1. memset32_post
  2. memset128

我想知道这两个有什么区别?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2012-03-11 07:09:23

我猜想memset128内核完成了大部分工作,而memset32_post内核清理了剩余的部分,因为您使用的大小不是128的倍数。

没有什么好担心的,它只是试图以尽可能高效的方式实现memset,尽管我会尝试在内部循环中避免memset (在任何处理器上)。如果你真的担心这件事,你可能会过度分配。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/9648534

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档