首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >程序执行优化

程序执行优化
EN

Stack Overflow用户
提问于 2014-02-04 05:12:18
回答 1查看 71关注 0票数 0

我正在编写一个抛物线时间价格系统的程序,以J.Welles Wilder Jr.写的书为基础。我已经完成了这个程序,运行时间为122微秒。这远远高于基准限值。我想找的是一些观点和建议

  1. 编写一个内核空间程序来实现同样的目标。通过驱动程序实现
  2. 真正热衷于这种方法是可能的,如果是的话,我应该如何和从哪里开始寻找,传递指令给图形驱动程序执行步骤和计算(在某个博客中阅读这篇文章)。

提前谢谢。

基于C语言的--->编程

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2014-02-04 05:27:20

使GPU非常快的是它可以异步运行大约2000~ (取决于卡)线程。如果代码可以划分为线程,那么在gpgpu上进行计算可能会提高性能,因为平均CPU速度是50-100 GFlops,如果正确使用,平均GPU速度是1500。另外,您可能需要考虑维护gpgpu代码的困难。我建议您,如果您有一个NVidia图形处理器,您应该签出‘托管CUDA’,因为它包含一个调试器和GPU分析器,这使得它可以使用。

TL;DR:只对异步代码使用gpgpu,如果可能的话最好使用“托管CUDA”。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/21544413

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档