我可以看到,gcc的PGO (配置文件引导优化)在我的应用程序中工作得很好(执行速度提高了约15%)。我使用'-fprofile-generate‘,然后使用'-fprofile-use’。但是,有没有办法生成一些报告,描述优化了什么以及如何优化?我知道英特尔编译器(icc)可以做到这一点,但是gcc呢?
发布于 2015-07-31 04:19:13
有-fdump-ipa-all或-fdump-ipa-cgraph,它们不会产生漂亮的报告,但这可能是你在“gcc”中找到的最接近优化报告的东西。还有一些优化选项有详细的输出,可以准确地告诉你优化了什么,比如-ftree-vectorizer-verbose=n。您可以查看更多详细信息here。
发布于 2018-08-19 15:34:14
一种选择是使用perf并分析缓存命中/未命中更改以及其他事件。虽然这不一定表示更改了什么,但它提供了针对优化可以进行哪些类型的更改的概述。
https://stackoverflow.com/questions/31732462
复制相似问题