当我进行性能调优时,我将首先在高级别上工作,并试图回答这个cpu绑定还是IO绑定?
当我确定这是cpu绑定时,我将尝试通过添加一些timer code.This来找到热点,但是我没有发现这些问题:
有谁知道如何测量这些物品吗?
发布于 2010-12-21 16:54:53
您对性能调优有不同的思考方式吗?
它不考虑I/O与CPU绑定、热点和计时器。
首先,只考虑一条线。线程的执行非常像一棵树。有一个主要功能(主干)。在调用子例程(分支)时有一些点。有终端指令(叶)和阻塞调用(如I/O (果树))。程序所用的总时间是所有叶子和所有水果的总和。
你想要做的是修剪树,使它尽可能轻,而不杀死它。
许多人所做的就是权衡整个事情,然后称一部分,以此类推,并希望找到热点(多叶的树枝),也许他们可以修剪。
另一种方法是随机选择一些叶子或果实。2)从每片叶子或果实上画一条线,沿着枝条画一条线,一直画到树干。(三)注意上面画有一条线以上的枝条。4)问:“我需要这支树枝吗?”如果你能修剪它,就这样做。你将消除树枝的全部重量,你不称它就做了。那就重新开始。
这就是random-pausing背后的想法。它不会发现某些类型的问题,但大多数问题都会很快找到,包括计时线程能够找到的任何问题。
发布于 2010-12-17 06:16:12
( 1)使用cache差磨/愈伤/卡其磨http://valgrind.org/info/tools.html#cachegrind。
在分析特定假设集下的内存局部性方面,非常有用。
2)正确地描述线程是非常痛苦的。在现代NUMA系统上,使用cpusets和process亲缘关系,它很快就会变得至关重要。
https://stackoverflow.com/questions/4468022
复制相似问题