首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何分析OpenMP瓶颈

如何分析OpenMP瓶颈
EN

Stack Overflow用户
提问于 2011-08-25 03:24:02
回答 4查看 9.5K关注 0票数 7

我有一个被OpenMP并行化的循环,但是由于任务的性质,有4个critical子句。

分析加速并找出哪些关键子句(或非关键子句(!))在循环中占用的时间最多,最好的方法是什么?

我使用Ubuntu10.04和g++ 4.4.3

EN

回答 4

Stack Overflow用户

回答已采纳

发布于 2011-08-25 11:15:24

OpenMP包含用于测量定时性能(docs here)的函数omp_get_wtime()和omp_get_wtick(),我建议您使用这些函数。

否则,请尝试使用分析器。我更喜欢google CPU profiler,它可以在here上找到。

还有this answer中描述的手动方式。

票数 3
EN

Stack Overflow用户

发布于 2011-08-25 20:20:05

Scalasca是一个很好的分析OpenMP (和MPI)代码并分析结果的工具。Tau也非常好用,但使用起来要难得多。英特尔的工具,如vtune,也很好,但非常昂贵。

票数 4
EN

Stack Overflow用户

发布于 2015-02-06 18:37:20

Arm MAP具有OpenMP和pthread分析功能--无需插入指令或修改源代码即可工作。您可以看到同步问题以及线程花费时间到源代码行级别的位置。OpenMP profiling的博客文章值得一读。

MAP被广泛用于高性能计算,因为它还分析多进程应用程序,如MPI。

票数 4
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/7181078

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档