文章/答案/技术大牛

发布

社区首页 >问答首页 >A9、A12、A15、A17、A53等生产线上的ARM浮点性能比较

问A9、A12、A15、A17、A53等生产线上的ARM浮点性能比较
EN

Stack Overflow用户

提问于 2014-03-06 07:22:39

回答 3查看 2.4K关注 0票数 0

我一直在研究手臂零件的相对性能，并发现很难拿出比较.特别是对于新的A12、A17和64位A53 an A57s；

到目前为止，基于Linpack的不同手机/平板电脑，我得出的结论是：

A9 = 32 MFLOPS/核心/GHz
A15 = 100 MFLOPS/核心/GHz
苹果A7 =350个MFLOPS /Core/GHz (!)

因此，出现了几个问题：

A12，A17，A53，A57在什么地方适合这个光谱？
为什么苹果的A7浮点数这么好？这完全是因为64位的内部结构，还是别的什么？

ipad

arm

回答 3

Stack Overflow用户

回答已采纳

发布于 2014-03-06 18:04:14

这些Linpack结果是通过Java实现的。下面是我通过C和Java获得的Linpack结果。更多的MFLOPS速度，请参见下面的内容。

http://www.roylongbottom.org.uk/android%20benchmarks.htm

 System   ARM    MHz   Android  Linpackv5  Linpackv7  LinpackSP NEONLinpack LinpackJava
                                  MFLOPS     MFLOPS     MFLOPS     MFLOPS     MFLOPS

  T1    926EJ    800       2.2      5.63       5.67       9.61       N/A        2.33
  P4    v7-A8    800     2.3.5                80.18                            28.34 @G
  T2    v7-A9    800     2.3.4     10.56     101.39     129.05     255.77      33.36
  P5    v7-A9   1500     4.0.3               171.39                            50.87 @G
  T4    v7-A9   1500a    4.0.3     16.86     155.52     204.61     382.46      56.89
  T6    v7-A9   1600     4.0.3               196.47
  T7    v7-A9   1300a    4.1.2     17.08     151.05     201.30     376.00      56.44
  T9    926EJ    800       2.2      5.66
  T11   v7-A15  2000b    4.2.2     28.82     459.17     803.04    1334.90     143.06
  T12   v7-A9   1600     4.1.2               147.07
  T14   v7-A9   1500     4.0.4               180.95

  P11   v7-A9   1400     4.0.4     19.89     184.44     235.54     454.21      56.99
  P10   QU-S4   1500     4.0.3               254.90

 Measured MHz a=1200, b=1700 

 System - T = Tablet, P = Phone, E = Emulator, @G = GreenComputing, QU = Qualcomm CPU

票数 3

Stack Overflow用户

发布于 2014-03-06 16:49:29

我不知道你是从哪里得到这些数字的，但它们根本不能反映硬件的能力。例如，皮质-A9可以在每一个周期执行双精度触发器，即1 1GFLOP/Core/GHz。通过LAPACK和BLAS的良好实现，您可以在linpack上实现700+MFLOP/Core/GHz。这比你报告的数字快20倍。皮质-A15和苹果A7更强大。

我希望您运行的是一些随机的"linpack基准测试“，而不是架构优化的实现。您不是在测量硬件的FP功能；而是通过一些随机开发人员代码的质量以及用于编译/执行程序的JIT和运行时或编译器的质量来度量该功能的苍白阴影。

票数 1

Stack Overflow用户

发布于 2014-03-08 12:43:20

除非确定了CPU模型和实际工作GHz，否则不可能理解这些比较基准图。还有一些身份不明的变量，如缓存大小和内存速度。例如，Galaxy可以有ARM或Snap巨龙CPU、不同数量的内核和不同的GHz规范(它们可能无法运行)。然后，应该确定基准的来源。即使它们是从相同的C代码编译的，您也不能总是信任某个特定供应商提供或优化的编译。

我非常熟悉的Linpack基准测试就是一个很好的例子。我最初的PCs版本被最初基准测试的作者Jack所接受，并且可以在Netlib (和我的网站)上找到。有两个基本版本(加上并行处理器的其他版本)。除了MP版本之外，我所有的初始Linpack基准测试都使用了Linpack 1的固定方法，其矩阵为100。第二个版本是用于求解1000阶方程组，对方法或实现没有任何限制。这可以展示特定体系结构或聪明的数学家的优势，并且通常可以反映MP的性能。

用于Android/Java的Linpack最受欢迎的版本来自GreeneComputing。根据数值结果，这是双精度，可能是N=500。我对下院议员的版本表示怀疑。它产生与单CPU版本不同的数值结果(Norm )，既可以指示“精度不一致的结果”，也可以使用Cortex A15 CPU崩溃我的平板电脑。

我有一个单一的CPU和多线程Linpack版本，所有使用Linpack 1固定方法，现在可以运行从N=100向上。由于使用RAM数据而不是缓存，随着N的增加，这些速度可能会变慢。MP版本速度慢得可怜，但至少产生了相同的Norm值。

Apple版本中有N个输入变量。结果表明: N=100 118MFLOPS，N=500 737MFLOPS，N=1000 918MFLOPS。N=500可能被引用，但不适合与我的结果进行比较。

A7比早期苹果核心更快的原因之一是提供了双重精度的霓虹灯指令。我的霓虹灯结果是单精度的。

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/22217790

复制

相似问题

问A9、A12、A15、A17、A53等生产线上的ARM浮点性能比较
EN

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问A9、A12、A15、A17、A53等生产线上的ARM浮点性能比较EN

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问A9、A12、A15、A17、A53等生产线上的ARM浮点性能比较
EN