我在试着理解node distances in numactl --hardware是什么意思?
在我们的集群中,它输出以下内容
numactl --hardware available: 2 nodes (0-1) node 0 cpus: 0 1 2 3 4 5 12 13 14 15 16 17 node 0 size: 32143 MB node 0 free: 188 MB node 1 cpus: 6 7 8 9 10 11 18 19 20 21 22 23 node 1 size: 32254 MB node 1 free: 69 MB node distances: node 0 1 0: 10 21 1: 21 10,这是我迄今为止所理解的:
numa集群上,我们必须对下一个集群进行“跳转”,以访问其他节点上的内存,这会导致更高的延迟。10和21是否表示“跃点”的延迟?如何在ns中找到延迟?在什么地方指明了吗?编辑:这链接说距离不是在ns中,而是相对距离。如何获得以ns为单位的绝对延迟?
任何帮助都将不胜感激。
发布于 2017-12-26 13:49:40
numactl --hardware为您提供有关硬件体系结构的统计信息,而不是关于其性能的统计数据。
如果你想要你的硬件的性能特征,你必须自己来衡量它,要么通过在线找到一个现有的,要么写你自己的基准。https://stackoverflow.com/a/47815885/1411628将给您一个关于如何开始编写自己的工作台的想法。
发布于 2018-07-31 10:51:38
要获得绝对延迟数,如果您在Intel系统中,可以对任何特定系统使用它们的内存延迟检查工具。https://software.intel.com/en-us/articles/intel-memory-latency-checker
它更倾向于使用根/管理权限来禁用硬件预取,否则会使数字倾斜,但如果没有,文档还指出,您可以要求它从其他节点获取随机元素,以便非常接近真实的数字,例如:
./mlc --latency_matrix -e -l128 -r
Intel(R) Memory Latency Checker - v3.5
Command line parameters: --latency_matrix -e -l128 -r
Using buffer size of 200.000MB
Measuring idle latencies (in ns)...
Numa node
Numa node 0 1
0 112.5 180.3
1 180.8 112.4https://stackoverflow.com/questions/47010413
复制相似问题