首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >LBR和侏儒对fp的perf记录选择是做什么的?

LBR和侏儒对fp的perf记录选择是做什么的?
EN

Stack Overflow用户
提问于 2019-08-09 12:44:08
回答 1查看 3.9K关注 0票数 15

当我在代码中使用perf record时,我为--call-graph选项找到了三种选择:lbr (最后一个分支记录)、dwarffp

这两者有什么区别呢?

EN

回答 1

Stack Overflow用户

发布于 2019-08-09 14:23:00

选项--call-graph指的是调用图/调用链的集合,即示例的函数堆栈。

默认的fp使用帧指针。这是非常有效的,但可能是不可靠的,特别是对优化的代码。通过显式地使用-fno-omit-frame-pointer,您可以确保这对于代码是可用的。尽管如此,图书馆的结果可能会有所不同。

使用dwarfperf实际上收集并存储堆栈内存本身的一部分,并对其进行后处理。这可能非常消耗资源,并且可能具有有限的堆栈深度。默认堆栈内存块为8 kiB,但可以配置。

lbr代表最后一次分支记录。这是Intel CPU支持的硬件机制。这可能会以可移植性为代价提供最好的性能。lbr也仅限于用户空间函数。

票数 15
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/57430338

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档