我想要创建roofline模型,我有问题的算法触发器每字节的比率。你能解释一下怎么算吗?该算法使用五点模板进行计算.
这是算法
for(int i=1; i<m-1; ++i) {
for(int j=1; j<n-1; ++j) {
outMax[i][j] = max( inMax[i][j], inMax[i][j-1], inMax[i][j+1],
inMax[i-1][j], inMax[i+1][j] );
}
}
swap(inMax, outMax)
for(int i=1; i<m-1; ++i) {
for(int j=1; j<n-1; ++j) {
outMin[i][j] = min( inMin[i][j], inMin[i][j-1], inMin[i][j+1],
inMin[i-1][j], inMin[i+1][j] );
}
}
swap(inMax, outMax)发布于 2015-08-21 17:55:45
通常情况下,roofline是每个循环或每个程序.因此,我可能会考虑第一个循环和第二个循环的触发器/字节。
对于每个循环:
同时,C/C++/Fortran程序中的每个循环和函数的自动Roofline模型生成(以及触发器/字节度量)可作为英特尔顾问公司2017年版产品startig中的头等功能提供,参见https://software.intel.com/en-us/articles/intel-advisor-roofline,https://www.codeproject.com/Articles/1169323/Intel-Advisor-。

请记住,某些roofline变体在如何定义“字节”值方面存在差异。
为模具找出触发器/字节和roofline模型是非常流行的话题,在roofline专家和开发人员中非常流行。因此,通过查看下面的链接,您可能会发现足够多的模板roofline示例,以便在您的特定情况下进行跟踪和重新应用,或者实现DRAM与L1之间的关系:
http://icsc2014.sjtu.edu.cn/wp-content/uploads/2014/05/Tutorial-Leopold1.pdf (特别是从第17页开始)
2014.pdf
https://stackoverflow.com/questions/32128318
复制相似问题