许多操作内核都使用Eigen::Tensor实现,它使用C++模板为多核CPU和GPU生成高效的并行代码;然而,我们自由地使用像cuDNN这样的库,可以实现更高效的内核实现。

扫码关注腾讯云开发者
领取腾讯云代金券
Copyright © 2013 - 2026 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有
深圳市腾讯计算机系统有限公司 ICP备案/许可证号:粤B2-20090059
粤公网安备44030502008569号
腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号
