如何使用arm_neon.h头文件来提高使用sin和cos函数的代码的性能。?该板是一个Xilinx T1加速器卡与ARM架构armv8-a和皮质a53.语言是c。
发布于 2021-12-15 05:31:13
arm_neon.h包含SIMD,它提供了一个用于访问/调用单个低级指令的C。
因此,如果您打算使用sin/cos加速arm_neon.h,则方法是使用向量算术同时计算4个值来重写这些三角函数。
你需要关注的事情是:
<代码>F 212
所有这些都将决定使用何种近似--多项式、线性分段多项式、有理多项式--以及哪些步骤或角情况可以省略。
https://stackoverflow.com/questions/70358719
复制相似问题