此库的最新版本为ARM处理器提供了加速,其中一些函数在arm汇编中进行了重写(在单独的文件motion_comp_arm_s.S中)。我的问题是,哪种arm汇编编译器适合这样的代码?---------------------------------------------------------------- .global MC_put_o_16_arm, {r4-r11, lr} @ R14 is also called LR
and r4, r
在一个研究项目中,我们正在开发一种特殊用途的浮点加速器.在此背景下,我们最初的设想是从ARM主机-> RISCV管理的加速器集群->中获得一种“两级”或“嵌套”卸载,即实际的浮点加速器。因此,我们希望实现类似于以下代码的目标:#pragma omp target // we are on RISCV
#pragma omp target-if是否有可能在OpenMP的未来API规范中加入一种嵌套卸载