首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >为什么cachegrind不是完全确定性的?

为什么cachegrind不是完全确定性的?
EN

Stack Overflow用户
提问于 2016-05-17 12:54:21
回答 1查看 349关注 0票数 7

Inspired by SQLite,我正在考虑使用valgrind的"cachegrind“工具来进行可重现的性能基准测试。它输出的数字比我发现的任何其他计时方法都要稳定得多,但它们仍然不是确定性的。作为示例,下面是一个简单的C程序:

代码语言:javascript
复制
int main() {
  volatile int x;
  while (x < 1000000) {
    x++;
  }
}

如果我编译它并在cachegrind下运行它,我会得到以下结果:

代码语言:javascript
复制
$ gcc -O2 x.c -o x
$ valgrind --tool=cachegrind ./x
==11949== Cachegrind, a cache and branch-prediction profiler
==11949== Copyright (C) 2002-2015, and GNU GPL'd, by Nicholas Nethercote et al.
==11949== Using Valgrind-3.11.0.SVN and LibVEX; rerun with -h for copyright info
==11949== Command: ./x
==11949==
--11949-- warning: L3 cache found, using its data for the LL simulation.
==11949==
==11949== I   refs:      11,158,333
==11949== I1  misses:         3,565
==11949== LLi misses:         2,611
==11949== I1  miss rate:       0.03%
==11949== LLi miss rate:       0.02%
==11949==
==11949== D   refs:       4,116,700  (3,552,970 rd   + 563,730 wr)
==11949== D1  misses:        21,119  (   19,041 rd   +   2,078 wr)
==11949== LLd misses:         7,487  (    6,148 rd   +   1,339 wr)
==11949== D1  miss rate:        0.5% (      0.5%     +     0.4%  )
==11949== LLd miss rate:        0.2% (      0.2%     +     0.2%  )
==11949==
==11949== LL refs:           24,684  (   22,606 rd   +   2,078 wr)
==11949== LL misses:         10,098  (    8,759 rd   +   1,339 wr)
==11949== LL miss rate:         0.1% (      0.1%     +     0.2%  )
$ valgrind --tool=cachegrind ./x
==11982== Cachegrind, a cache and branch-prediction profiler
==11982== Copyright (C) 2002-2015, and GNU GPL'd, by Nicholas Nethercote et al.
==11982== Using Valgrind-3.11.0.SVN and LibVEX; rerun with -h for copyright info
==11982== Command: ./x
==11982==
--11982-- warning: L3 cache found, using its data for the LL simulation.
==11982==
==11982== I   refs:      11,159,225
==11982== I1  misses:         3,611
==11982== LLi misses:         2,611
==11982== I1  miss rate:       0.03%
==11982== LLi miss rate:       0.02%
==11982==
==11982== D   refs:       4,117,029  (3,553,176 rd   + 563,853 wr)
==11982== D1  misses:        21,174  (   19,090 rd   +   2,084 wr)
==11982== LLd misses:         7,496  (    6,154 rd   +   1,342 wr)
==11982== D1  miss rate:        0.5% (      0.5%     +     0.4%  )
==11982== LLd miss rate:        0.2% (      0.2%     +     0.2%  )
==11982==
==11982== LL refs:           24,785  (   22,701 rd   +   2,084 wr)
==11982== LL misses:         10,107  (    8,765 rd   +   1,342 wr)
==11982== LL miss rate:         0.1% (      0.1%     +     0.2%  )
$

在这种情况下,"I refs“在两次运行之间只有0.008%的差异,但我仍然想知道为什么它们是不同的。在更复杂的程序中(几十毫秒),它们可以变化更多。有没有办法让这些运行完全可重现?

EN

回答 1

Stack Overflow用户

发布于 2016-05-25 03:34:59

a topic in gmane.comp.debugging.valgrind的末尾,Nicholas not ( Valgrind开发团队的Mozilla开发人员)说,使用Cachegrind时,小的变化是很常见的(我可以推断它们不会导致大问题)。

Cachegrind’s manual提到这个程序非常敏感。例如,在Linux上,地址空间随机化(用于提高安全性)可能是不确定性的根源。

另一件值得注意的事情是,结果非常敏感。更改被分析的可执行文件的大小,或者它使用的任何共享库的大小,甚至它们的文件名的长度,都可能会扰乱结果。变化会很小,但如果你的程序完全改变了,不要期望完全可重复的结果。

最近的GNU/Linux发行版确实解决了空间随机化,其中相同程序的相同运行将其共享库加载到不同的位置,作为一种安全措施。这也会扰乱结果。

虽然这些因素意味着你不应该相信结果是超级准确的,但它们应该足够接近,以便有用。

票数 5
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/37267427

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档