首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏DeepHub IMBA

    如何在GPU上设计高性能的神经网络

    NVBLAS是GEMM的Nvidia实现,它利用了内部的GPU架构,实现了平铺/块矩阵乘法。PyTorch和TensorFlow链接到Nvidia GPU上的这个库。类库为你做所有繁重的工作。

    1.4K10发布于 2020-07-16
  • 读懂DeepSeek开源周:一场技术普惠的嘉年华,极限提升大模型效率

    由于矩阵乘法可以分解为多组没有相互依赖关系的重复计算,工程师们定义了GEMM(GEneral Matrix Multiply,通用矩阵乘法)算子,而Nvidia也在cuBLAS和NVBLAS这两种数学库中

    50810编辑于 2025-03-04
领券