我正在尝试使用perf对一段用C编写的代码进行基准测试,我得到了超过100%的前端空闲周期计数。我看到后端的空闲周期也会发生这种情况。两者同时超过100个。每个周期的指令数量是相当高的--从5 - 10开始。
3,569,966 stalled-cycles-frontend # 111.98% frontend cycles idle
1,843,327 stalled-cycles-backend # 57.82% backend cycles idle
17,875,020 instructions # 5.61 insns per cycle
# 0.20 stalled cycles per insn当百分比这么高时,这意味着什么?
发布于 2015-04-06 10:02:38
这些百分比是相对于活动CPU周期的,显示为cycles。因此,cycles不是总周期,而是活动CPU周期,并根据它计算前端或后端停滞周期。
https://stackoverflow.com/questions/26932153
复制相似问题