文章/答案/技术大牛

发布

问确定ASM程序的FLOPS
EN

Stack Overflow用户

提问于 2015-01-26 07:41:22

回答 1查看 1.2K关注 0票数 10

我们必须实现一个ASM程序来乘以坐标方案格式(COOS)和压缩行格式(CSR)中的稀疏矩阵。现在我们已经实现了所有这些算法，我们想知道与通常的矩阵乘法相比，它们的性能有多高。我们已经实现了代码来测量所有这些算法的运行时间，但现在我们决定还要知道我们可以执行多少次每秒的浮点运算(FLOPS)。有没有关于如何测量/计算这个的建议？

以下是所用系统的一些背景信息：

processor   : 0
model name  : ARMv7 Processor rev 2 (v7l)
Features    : swp half thumb fastmult vfp edsp thumbee neon vfpv3 tls vfpd32 
CPU implementer : 0x41
CPU architecture: 7
CPU variant : 0x3
CPU part    : 0xc08
CPU revision    : 2

我们的第一个想法是现在实现一种FPO计数器，我们在每次浮点操作(算术操作以及比较和移动操作)后递增，但这意味着我们必须在代码中插入递增操作，这也会减慢应用程序...有没有人知道有没有某种硬件计数器来计算浮点运算的数量，或者有没有某种性能工具可以用来监控我们的程序并测量FPO的数量。如有任何建议或指示，我们将不胜感激。

下面是使用计数方法对矩阵乘法的FLOP进行评估。我们首先测量我们感兴趣的每条指令的运行时间，然后计算每秒浮点操作的数量。

arm

neon

flops

assembly

回答 1

Stack Overflow用户

发布于 2015-05-05 09:32:51

核心数x平均频率x每个周期的运算数

票数 -1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/28142923

复制

相似问题

问确定ASM程序的FLOPS
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问确定ASM程序的FLOPSEN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问确定ASM程序的FLOPS
EN