许多线性代数例程都有常数,例如alpha和beta作为参数。例如,丘布拉斯?执行以下操作:
C :=α*op(A )_op( B)+ beta_C
假设我将beta设置为0。
const double,而在示例中则将double值传递给它们?有什么关系呢?如果这些库以我所描述的方式浪费操作,我会感到惊讶,但除了提到的cuBLAS文档之外,我没有发现任何关于它的明确讨论:
如果beta == 0,那么C不一定是有效的输入。
发布于 2018-07-16 08:33:42
甚至参考实现也在这里进行优化。不管alpha或beta的值如何,都没有认真的实现来执行操作。
beta=0.忽略C. beta=1.跳过缩放const之前,FORTRAN中没有F90变量。BLAS接口是在F90之前定义的,每个人都遵守约定。我想要一个C接口,有适当的关键字,看看c特定的接口,比如sblas_dgemm。以下是DGEMM的参考实现。source.html。寻找Quick return if possible.,And if alpha.eq.zero.等
https://stackoverflow.com/questions/51355427
复制相似问题