首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >确定ASM程序的FLOPS

确定ASM程序的FLOPS
EN

Stack Overflow用户
提问于 2015-01-26 07:41:22
回答 1查看 1.2K关注 0票数 10

我们必须实现一个ASM程序来乘以坐标方案格式(COOS)和压缩行格式(CSR)中的稀疏矩阵。现在我们已经实现了所有这些算法,我们想知道与通常的矩阵乘法相比,它们的性能有多高。我们已经实现了代码来测量所有这些算法的运行时间,但现在我们决定还要知道我们可以执行多少次每秒的浮点运算(FLOPS)。有没有关于如何测量/计算这个的建议?

以下是所用系统的一些背景信息:

代码语言:javascript
复制
processor   : 0
model name  : ARMv7 Processor rev 2 (v7l)
Features    : swp half thumb fastmult vfp edsp thumbee neon vfpv3 tls vfpd32 
CPU implementer : 0x41
CPU architecture: 7
CPU variant : 0x3
CPU part    : 0xc08
CPU revision    : 2

我们的第一个想法是现在实现一种FPO计数器,我们在每次浮点操作(算术操作以及比较和移动操作)后递增,但这意味着我们必须在代码中插入递增操作,这也会减慢应用程序...有没有人知道有没有某种硬件计数器来计算浮点运算的数量,或者有没有某种性能工具可以用来监控我们的程序并测量FPO的数量。如有任何建议或指示,我们将不胜感激。

下面是使用计数方法对矩阵乘法的FLOP进行评估。我们首先测量我们感兴趣的每条指令的运行时间,然后计算每秒浮点操作的数量。

EN

回答 1

Stack Overflow用户

发布于 2015-05-05 09:32:51

核心数x平均频率x每个周期的运算数

票数 -1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/28142923

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档