NVBLAS是GEMM的Nvidia实现,它利用了内部的GPU架构,实现了平铺/块矩阵乘法。PyTorch和TensorFlow链接到Nvidia GPU上的这个库。类库为你做所有繁重的工作。
由于矩阵乘法可以分解为多组没有相互依赖关系的重复计算,工程师们定义了GEMM(GEneral Matrix Multiply,通用矩阵乘法)算子,而Nvidia也在cuBLAS和NVBLAS这两种数学库中