我一直在研究手臂零件的相对性能,并发现很难拿出比较.特别是对于新的A12、A17和64位A53 an A57s;
到目前为止,基于Linpack的不同手机/平板电脑,我得出的结论是:
因此,出现了几个问题:
发布于 2014-03-06 18:04:14
这些Linpack结果是通过Java实现的。下面是我通过C和Java获得的Linpack结果。更多的MFLOPS速度,请参见下面的内容。
http://www.roylongbottom.org.uk/android%20benchmarks.htm
System ARM MHz Android Linpackv5 Linpackv7 LinpackSP NEONLinpack LinpackJava
MFLOPS MFLOPS MFLOPS MFLOPS MFLOPS
T1 926EJ 800 2.2 5.63 5.67 9.61 N/A 2.33
P4 v7-A8 800 2.3.5 80.18 28.34 @G
T2 v7-A9 800 2.3.4 10.56 101.39 129.05 255.77 33.36
P5 v7-A9 1500 4.0.3 171.39 50.87 @G
T4 v7-A9 1500a 4.0.3 16.86 155.52 204.61 382.46 56.89
T6 v7-A9 1600 4.0.3 196.47
T7 v7-A9 1300a 4.1.2 17.08 151.05 201.30 376.00 56.44
T9 926EJ 800 2.2 5.66
T11 v7-A15 2000b 4.2.2 28.82 459.17 803.04 1334.90 143.06
T12 v7-A9 1600 4.1.2 147.07
T14 v7-A9 1500 4.0.4 180.95
P11 v7-A9 1400 4.0.4 19.89 184.44 235.54 454.21 56.99
P10 QU-S4 1500 4.0.3 254.90
Measured MHz a=1200, b=1700
System - T = Tablet, P = Phone, E = Emulator, @G = GreenComputing, QU = Qualcomm CPU发布于 2014-03-06 16:49:29
我不知道你是从哪里得到这些数字的,但它们根本不能反映硬件的能力。例如,皮质-A9可以在每一个周期执行双精度触发器,即1 1GFLOP/Core/GHz。通过LAPACK和BLAS的良好实现,您可以在linpack上实现700+MFLOP/Core/GHz。这比你报告的数字快20倍。皮质-A15和苹果A7更强大。
我希望您运行的是一些随机的"linpack基准测试“,而不是架构优化的实现。您不是在测量硬件的FP功能;而是通过一些随机开发人员代码的质量以及用于编译/执行程序的JIT和运行时或编译器的质量来度量该功能的苍白阴影。
发布于 2014-03-08 12:43:20
除非确定了CPU模型和实际工作GHz,否则不可能理解这些比较基准图。还有一些身份不明的变量,如缓存大小和内存速度。例如,Galaxy可以有ARM或Snap巨龙CPU、不同数量的内核和不同的GHz规范(它们可能无法运行)。然后,应该确定基准的来源。即使它们是从相同的C代码编译的,您也不能总是信任某个特定供应商提供或优化的编译。
我非常熟悉的Linpack基准测试就是一个很好的例子。我最初的PCs版本被最初基准测试的作者Jack所接受,并且可以在Netlib (和我的网站)上找到。有两个基本版本(加上并行处理器的其他版本)。除了MP版本之外,我所有的初始Linpack基准测试都使用了Linpack 1的固定方法,其矩阵为100。第二个版本是用于求解1000阶方程组,对方法或实现没有任何限制。这可以展示特定体系结构或聪明的数学家的优势,并且通常可以反映MP的性能。
用于Android/Java的Linpack最受欢迎的版本来自GreeneComputing。根据数值结果,这是双精度,可能是N=500。我对下院议员的版本表示怀疑。它产生与单CPU版本不同的数值结果(Norm ),既可以指示“精度不一致的结果”,也可以使用Cortex A15 CPU崩溃我的平板电脑。
我有一个单一的CPU和多线程Linpack版本,所有使用Linpack 1固定方法,现在可以运行从N=100向上。由于使用RAM数据而不是缓存,随着N的增加,这些速度可能会变慢。MP版本速度慢得可怜,但至少产生了相同的Norm值。
Apple版本中有N个输入变量。结果表明: N=100 118MFLOPS,N=500 737MFLOPS,N=1000 918MFLOPS。N=500可能被引用,但不适合与我的结果进行比较。
A7比早期苹果核心更快的原因之一是提供了双重精度的霓虹灯指令。我的霓虹灯结果是单精度的。
https://stackoverflow.com/questions/22217790
复制相似问题