CPU缓存总是中断我们测试一些代码的性能。
gettime();
func1();
gettime();
gettime();
func2();
gettime();
// func2 is faster because of the cache.(or page faults of func1())
// But we often misunderstand.在测量代码性能时,如何消除缓存的影响。
我正在寻找一些函数或方法来在Windows中做到这一点。
请给我你的小费。谢谢。
发布于 2010-10-30 22:38:02
可以做的一件事是调用一个函数,该函数有很多代码,并且在两次调用之间访问大量内存来分析您正在分析的项。例如,在伪代码中(主要是语言中立的):
// loop some number of times
{
//start timing
profile_func();
//stop timing
//add to total time
large_func(); // Uses lots of memory and has lots of code
}
// Compute time of profile func by dividing number of iterations by total timelarge_func()中的代码可以是无意义的代码,就像一组反复重复的操作。关键是它或它的代码在编译时没有得到优化,因此它实际上清除了CPU的代码和数据缓存(以及L2和L3 (如果存在)缓存)。
对于许多情况,这是一项非常重要的测试。这很重要的原因是,经常被隔离分析的小的快速函数可以非常快地运行,利用CPU缓存、内联和注册。但是,通常情况下,在大型应用程序中,由于调用这些快速函数的上下文,这些优势是不存在的。
例如,仅仅通过在紧凑的循环中运行一百万次迭代来分析一个函数,可能会显示该函数在比方说50纳秒内执行。然后你使用我上面展示的框架运行它,突然它的运行时间可能会急剧增加到微秒,因为它不能再利用它拥有整个处理器的事实-它的寄存器和缓存。
发布于 2010-10-30 22:37:38
好的代码利用缓存,所以你不能简单地关闭它(你可以,但这些结果将完全无关紧要)。
您需要的是在连续的测试之间清空(或无效)缓存。这里有一些提示:Invalidating the CPU's cache
https://stackoverflow.com/questions/4059125
复制相似问题