首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在Intel Xeon Phi上使用OpenCL进行并发模拟

在Intel Xeon Phi上使用OpenCL进行并发模拟
EN

Stack Overflow用户
提问于 2016-04-11 22:53:52
回答 1查看 62关注 0票数 0

我有一个OpenCL应用程序,它未充分利用英特尔至强Phi的功能。

内核使用数据库进行一些统计计算。因此,我在想是否有可能添加第二个使用相同数据库的内核,并在Phi上同时运行它们。

例如,为内核1使用n/2个线程,为内核2使用n/2个线程,等等。

有什么建议吗?

EN

回答 1

Stack Overflow用户

发布于 2016-04-12 17:29:12

未充分利用英特尔至强Phi的功能。

  • under-utilizes内存?算术单元?缓存?你有没有把它分析到problems?

对内核1使用n/2线程,对内核2使用n/2线程,依此类推

  • 如果内核使用了太多的内存并且缓存没有命中,你可以减少内核中循环的限制,这样每个线程使用更少的内存,并且可能更频繁地访问缓存,然后应用第二个内核来处理剩余的循环。如果每个线程有m个元素,则可以:

代码语言:javascript
复制
- n threads (for i = 0 to m/2)   +   n threads (for i=m/2 to m)  
    - similar to matrix multiplication in patches to use more cache

  • 手动将内核矢量化为16宽的组件,如int16和float16。
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/36552157

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档