我使用roofline模型进行代码优化分析。
但是我发现带绿色的点是超出边界的区域,bandwidth.The程序可以运行没有问题。
我不明白为什么绿点不在红色区域。
这台机器是一个2核的虚拟机,我的本地物理机器有4 cores.The分析工具是英特尔顾问。





发布于 2022-10-27 08:45:18
如果应用程序不受DRAM的绑定,而是由CPU缓存,则这是可能的,后者的吞吐量要高得多。例如,应用程序可以被处理器的LLC缓存绑定(LLC意味着最后一级缓存,这通常是一个三级缓存)。
请注意,对于相对最近的处理器来说,4.26峰值触发器的性能非常低(AFAIKMyi5-9600KF双精度可达200 GFlops,简单精度可达400 GFlops )。36.31是更现实的,但仍然相当低,除非您的目标处理器相当旧或是嵌入式/移动处理器。另外,请注意,在共享机器上运行的虚拟机通常不适合分析,因为用户可能同时使用DRAM运行其他应用程序,从而导致错误的分析结果。
https://stackoverflow.com/questions/74218511
复制相似问题