腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
搜索
关闭
文章
问答
(293)
视频
开发者手册
清单
用户
专栏
沙龙
全部问答
原创问答
Stack Exchange问答
更多筛选
回答情况:
全部
有回答
回答已采纳
提问时间:
不限
一周内
一月内
三月内
一年内
问题标签:
未找到与 相关的标签
筛选
重置
3
回答
多线程
GEMM
比单线程
GEMM
慢?
我写了一些简单的
GEMM
代码,我想知道为什么它比同等的单线程
GEMM
代码慢得多。 200x200矩阵,单线程: 7ms,多线程: 108ms,CPU: 3930k,线程池中有12个线程。
浏览 4
提问于2013-02-11
得票数 4
回答已采纳
1
回答
Fortran递归与
GEMM
我正在尝试在Fortran中实现CARMA
GEMM
算法,该算法在本文中找到。) PROGRAM RECURSION_
GEMM
IMPLICIT NONE CALL <em
浏览 0
修改于2018-04-07
得票数 1
3
回答
BLAS:
gemm
与gemv
为什么BLAS有一个用于矩阵-矩阵乘法的
gemm
函数和一个用于矩阵-向量乘法的单独的gemv函数?矩阵-向量乘法不只是矩阵-矩阵乘法的特例,其中一个矩阵只有一行/列吗?
浏览 3
提问于2011-08-16
得票数 24
回答已采纳
1
回答
朱莉娅: BLAS.
gemm
!()参数
要做到这一点,对于我来说,
gemm
()函数的两个第一个参数的意义并不明显。参数'N'和'T'代表什么?BLAS.
gemm
和BLAS.
gemm
!有什么区别?
浏览 3
修改于2017-11-30
得票数 2
回答已采纳
1
回答
Blas
GEMM
发射失败:
_handle, device_name, op_name, tensorflow.python.framework.errors_impl.InternalError: Blas
GEMM
launch
浏览 23
提问于2021-05-06
得票数 0
回答已采纳
1
回答
使用
GEMM
的cublas AA‘
我试图找到计算AA的乘法,其中A是MxN,我试着这样做: double bet =0.0f; // bet =1但是它给出了分割误差double ** m = (double**)malloc(rows * sizeof(double*));int i,j
浏览 6
提问于2017-07-16
得票数 1
回答已采纳
2
回答
TensorFlow Blas
GEMM
启动失败
我正在尝试运行一个简单的CNN,我得到了错误信息"Blas
GEMM
启动失败“。在我的机器上正确设置了TensorFlow 2.1.0,我能够成功地执行tensorflow示例。core/common_runtime/base_collective_executor.cc:217] BaseCollectiveExecutor::StartAbort Internal: Blas
GEMM
File "<string>", line 3, in raise_from tensorflow.pytho
浏览 4
提问于2020-01-22
得票数 0
19
回答
TensorFlow: Blas
GEMM
启动失败
)), 467 finally: 1053 --> 466 pywrap_tensorflow.TF_GetCode(status)) 46
浏览 6
修改于2017-05-16
得票数 55
1
回答
使用Numpy einsum的
GEMM
一个numpy einsum语句能复制功能吗?标量和矩阵乘法看起来很简单,但我还没有找到如何让"+“工作的方法。如果它更简单,D=α*A*B+ beta *C是可以接受的(实际上更可取)beta = 3B = A + 1print(left_part)print(left_part)
浏览 0
提问于2016-10-11
得票数 3
回答已采纳
2
回答
OpenCL
gemm
内核本地内存变慢
编辑:这是我的卡片故障...本地内存内核的速度要快几倍,抱歉!以下是内核: "__kernel\n" " {\n" "
浏览 0
修改于2012-08-02
得票数 0
1
回答
Blas
GEMM
发射在张量流中失败
**Exception has occurred: InternalError Blas
GEMM
launch failed : a.shape=(5000, 3), b.shape=(3, 20),
浏览 5
提问于2021-12-04
得票数 2
1
回答
临时数组创建和例程
GEMM
当我运行Fortran代码时,我得到这样的警告:与这部分代码相关 ! Vw(a,:)=V(a,:)*w(iw,:) call zg
浏览 5
提问于2021-06-20
得票数 0
2
回答
默认流中始终启动CUBLAS
gemm
中的memset
我注意到,当从主机调用每个
gemm
的cublasSgemm函数时,有三个内核调用: memset、scal_kernel和
gemm
内核本身(例如sgemm_large)。一个想法是使用DP和运行
gemm
功能的设备版本,但这将只在CC3.0和更高版本上工作。
浏览 3
修改于2016-01-01
得票数 2
回答已采纳
1
回答
OpenMP并行化
GEMM
的错误结果
我知道OpenMP在所有工作人员之间共享在外部作用域中声明的所有变量。这就是我的问题的答案。但我真的不明白为什么函数omp3提供正确的结果,而函数omp2提供错误的结果。 for (int i = 0; i < m; ++i) { for (int ki = 0; ki < k; ++ki) { for (int j = 0; j < n; ++j)
浏览 3
提问于2022-04-27
得票数 1
回答已采纳
1
回答
奇怪的cuBLAS
gemm
批处理性能
我注意到cublasSgemmStridedBatched的一些奇怪的性能,我正在寻找一个解释。矩阵大小固定在20x20。以下是几个不同批次大小的时间(只有乘法,没有数据传输): 如果矩阵大小固定在10x10,并且再次执行试用
浏览 0
修改于2018-01-30
得票数 4
回答已采纳
1
回答
InternalError (回溯参见上文):Blas
GEMM
启动失败
raise type(e)(node_def, op, message) InternalError (see above for traceback): Blas
GEMM
浏览 2
修改于2017-11-01
得票数 0
回答已采纳
1
回答
C-连续矩阵上的Fortran
gemm
函数
我试图使用fortran
gemm
函数进行矩阵乘法,参见。我使用从
gemm
导出的这个函数,这意味着,我没有其他选择,而不是玩这个Fortran订购的东西。
浏览 3
修改于2016-07-02
得票数 3
回答已采纳
3
回答
tensorflow-gpu无法使用Blas
GEMM
启动失败
BLAS supporttensorflow.python.framework.errors_impl.InternalError: Blas
GEMM
_traceback = _extract_stack() InternalError (see above for
浏览 24
修改于2017-08-05
得票数 7
回答已采纳
1
回答
GEMM
在Tensorflow,Theano,Py火炬中使用吗?
https://petewarden.com/2015/04/20/why-
gemm
-is-at-the-heart-of-deep-learning/ 我想了解其他深层次的学习框架,如Theano,Tensorflow
浏览 0
提问于2018-08-12
得票数 1
1
回答
内存受限情况下
GEMM
的有效算法
我正在寻找一个高效的算法来执行(密集的)大型矩阵乘法在GPU上。更具体地说,对于GPU没有足够内存容纳所有矩阵的情况(例如,m=n=k=100,000)。我使用cuBLAS在块中执行矩阵乘法,我可以想到许多基于块的方法,但是它们效率很低,因为A、B或C矩阵必须多次复制到或从GPU复制。
浏览 7
提问于2022-03-01
得票数 0
第 2 页
第 3 页
第 4 页
第 5 页
第 6 页
第 7 页
第 8 页
第 9 页
第 10 页
第 11 页
点击加载更多
领券