我有一个OpenCL应用程序,它未充分利用英特尔至强Phi的功能。
内核使用数据库进行一些统计计算。因此,我在想是否有可能添加第二个使用相同数据库的内核,并在Phi上同时运行它们。
例如,为内核1使用n/2个线程,为内核2使用n/2个线程,等等。
有什么建议吗?
发布于 2016-04-12 17:29:12
未充分利用英特尔至强Phi的功能。
?
对内核1使用n/2线程,对内核2使用n/2线程,依此类推
- n threads (for i = 0 to m/2) + n threads (for i=m/2 to m)
- similar to matrix multiplication in patches to use more cache
https://stackoverflow.com/questions/36552157
复制相似问题