腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
搜索
关闭
文章
问答
(9999+)
视频
开发者手册
清单
用户
专栏
沙龙
全部问答
原创问答
Stack Exchange问答
更多筛选
回答情况:
全部
有回答
回答已采纳
提问时间:
不限
一周内
一月内
三月内
一年内
问题标签:
未找到与 相关的标签
筛选
重置
1
回答
Tensorflow Keras中
稀疏
稠密MultiHead的注意
为了一个目标,我试图计算
稀疏
矩阵和稠密矩阵的MultiHead注意矩阵。我知道默认情况下,需要两个密集矩阵,然后在使用Vaswani集的查询、键和值进行Softmax操作后返回注意值。但是,我有一个用例,其中我有一个
稀疏
和密集的矩阵,我希望将它们分别作为查询和值传递到MultiHead注意层。 默认情况下,不支持,转换为密集和返回不是一个选项,因为时间复杂性增长了很多。有没有任何方法可以覆盖与
稀疏
密集组合不兼容的内部应用程序,或者用诸如sparse_dense_matmul这样的混合API来代替它们来进行
注意力
计算?尽管如
浏览 7
修改于2022-07-08
得票数 0
1
回答
注意体重的LSTM??基于句子嵌入的文档分类
And,之后添加一个 TimeDistributed 稠密层,如何从我的网络中检索
注意力
权重(为了可视化目的)?--这样我就知道哪个句子对文档被归类为好的或坏的负有“责任”。y= [1,0,0,1,1]我不需要嵌入层,因为每个文档的每个句子都是
稀疏
向量。但是,我怎样才能从中获得
注意力
-权重(例如,我知道是哪一句导致了1的分类)?非常感谢的帮助
浏览 2
修改于2020-01-11
得票数 0
回答已采纳
1
回答
我应该多久更新一次登录cookie?
我还没有编写代码,因为我对cookies的使用还很陌生,并且试图把我的
注意力
集中在cookies编码的概念上。我将对我的登录系统中cookie和会话数据的使用进行梳理。每次服务器检查时,我是否应该更新以查看用户是否已登录,还是应该是
稀疏
的?应该只在没有找到会话并检查cookie有效性的情况下更新它吗?
浏览 0
修改于2018-04-17
得票数 0
回答已采纳
1
回答
为什么在“变形金刚”中使用多头
注意力
?
我发现了下面的 什么是“
注意力
被单词本身所支配”,使用多个头是如何解决这个问题的?
浏览 0
修改于2021-03-17
得票数 4
回答已采纳
1
回答
稀疏
*稠密矩阵乘法运算数
使用优化的
稀疏
例程(如cuSparse或特征或Matlab)乘CSR
稀疏
x密集矩阵或密集x CSR
稀疏
矩阵需要多少浮点运算。在
稀疏
矩阵完全密集的极限中,操作的数量是N^2*(2*N-1) --那么,当
稀疏
矩阵不够
稀疏
时,为什么
稀疏
例程比密集例程慢呢?正在进行哪些额外工作?
浏览 1
修改于2018-07-15
得票数 1
回答已采纳
2
回答
注意力
机制真的是
注意力
,还是只是再一次回顾记忆?
在阅读
注意力
机制时,我对
注意力
这个术语感到困惑。我们的
注意力
是否和通常的定义中描述的一样?
浏览 22
提问于2019-03-03
得票数 1
回答已采纳
1
回答
为什么变压器中的注意层要学习上下文?
我理解变压器体系结构(从“注意就是你所需要的”),以及如何在多头
注意力
层中计算
注意力
。 我感到困惑的是,为什么
注意力
层的输出是上下文向量。也就是说:变压器的训练方式如何使
注意力
层学习上下文?我希望在这篇论文中看到的是这样一个道理:“当你训练一个变压器时,当你把
注意力
集中在顺序到顺序的任务上时,
注意力
层就会学习上下文,这就是为什么……”。为什么不能让
注意力
层学习到一些其他的特性,这些特性在顺序上对任务的排序也是有益的呢?我们怎么知道他们学习的是语境,而不是我们所观察到的?
浏览 0
提问于2020-11-12
得票数 1
1
回答
注意在非NLP领域使用的例子?
当我寻找
注意力
实现示例时,带有
注意力
的编码器-解码器结构总是出现在第一位。除了自然语言处理之外,有没有其他领域使用
注意力
的例子?
浏览 2
提问于2020-02-20
得票数 0
1
回答
矩阵的
稀疏
或密集存储
我正在处理不是非常
稀疏
的大型
稀疏
矩阵,我总是在想,需要多少
稀疏
性才能将矩阵存储为
稀疏
矩阵才是有益的?我们知道,一个相当密集的矩阵的
稀疏
表示可以具有比原始矩阵更大的大小。那么,矩阵的密度是否有一个阈值,以便更好地将其存储为
稀疏
矩阵?我知道这个问题的答案通常取决于
稀疏
性的结构,等等,但我想知道是否有一些指导原则?例如,我有一个非常大的矩阵,密度约为42%。我应该将这个矩阵存储为密集的还是
稀疏
的?
浏览 0
提问于2014-08-26
得票数 3
1
回答
在tensorflow嵌入
注意力
seq2seq中,projection_output是如何影响
注意力
向量大小的
我不知道为什么输出投影会影响
注意力
向量的大小。在我看来,
注意力
机制是基于单元格输出计算的,在被
注意力
使用之前,没有对单元格输出进行投影操作。那么,输出投影如何影响
注意力
向量的大小呢? 非常感谢,并恳求一些解释...
浏览 0
提问于2017-03-18
得票数 0
1
回答
Linux内核运行
稀疏
失败- /bin/sh: 1:
稀疏
:未找到
我在linux内核上运行
稀疏
。错误2 /bin/sh: 1: llvm-config:not安装‘parse.h’->‘/home/lovegcy/include/
稀疏
/p
浏览 8
提问于2013-08-09
得票数 2
回答已采纳
3
回答
CUDA中的
稀疏
矩阵加法
我正在考虑使用CUDA C来解决一个涉及
稀疏
矩阵加法的特殊问题。 似乎只讨论
稀疏
对象和密集对象之间的操作。这也让我想到:
稀疏
-
稀疏
加法是如此琐碎,可能只是使用“+”或类似的情况;或者
稀疏
-
稀疏
加法没有实现。哪个是正确的,我在哪里可以找到文档?
浏览 2
修改于2018-12-26
得票数 1
回答已采纳
2
回答
将python
稀疏
矩阵导入MATLAB中
我在python中有一个CSR
稀疏
格式的
稀疏
矩阵,我想将它导入MATLAB。MATLAB没有CSR
稀疏
格式。对于所有类型的矩阵,它只有一个
稀疏
格式。由于矩阵是非常大的密集格式,我想知道如何导入它作为一个MATLAB
稀疏
矩阵?
浏览 3
提问于2014-09-08
得票数 8
回答已采纳
1
回答
注意力
网络是如何工作的?
最近我在读“
注意力
就是你所需要的一切”这篇论文,通过它,我发现了一个关于理解
注意力
网络的问题,如果我忽略了它背后的数学原理。有没有人能举个例子让我理解
注意力
网络?
浏览 1
提问于2019-12-05
得票数 4
1
回答
检查Server中的可空列是
稀疏
的还是不被查询的
我知道如何在创建或更改表时添加
稀疏
。ALTER COLUMN C1 VARCHAR(50) SPARSE NULL并且可以对
稀疏
列执行
稀疏
查询。只是想知道是否有任何方法来检查列是否已被设置为
稀疏
的?基本上,我正在尝试创建一个脚本,该脚本将确定sql server的兼容性级别,如果它支持
稀疏
,那么它将检查“列是否已被
稀疏
”,如果没有,则需要更改该列并添加
稀疏
。如果能够确定空百分比,情况会更好。
浏览 0
修改于2014-10-13
得票数 2
回答已采纳
2
回答
一种快速的位旋转运算整数矩阵乘法方法
为了保持我们的
注意力
集中,让我们非常具体地说,我有两个3x3矩阵,带有整数条目0<=x<15。 } }return 0;备注: 矩阵不一定是
稀疏
的
浏览 3
修改于2017-05-23
得票数 7
回答已采纳
1
回答
如何实现tensorflow中的
稀疏
卷积?
我知道tensorflow提供了一些处理
稀疏
张量的方法。例如,当存在
稀疏
矩阵时,tf.sparse_tensor_dense_matmul比tf.matmul更快。在深卷积网络中,经过训练得到
稀疏
卷积核。我想知道如何保存卷积核,使tensorflow知道内核是
稀疏
的? 我看过一些报纸。本文提出了
稀疏
卷积比传统卷积更有效的计算方法。但是,tf.nn.conv2d并不表示它将比密集卷积核更快地用
稀疏
卷积核进行计算。如何从
稀疏
的内核中获得优势?
浏览 4
提问于2017-05-25
得票数 2
回答已采纳
1
回答
python中的邻近矩阵
对于非常大的
稀疏
向量,计算距离/邻近矩阵的最佳方法是什么?例如,您将得到以下设计矩阵,其中每行为68771维
稀疏
向量。designMatrix <5830x68771型
稀疏
矩阵与压缩
稀疏
行format>中存储的1229041个元素
浏览 2
提问于2011-03-18
得票数 1
回答已采纳
1
回答
关于向图中输入
稀疏
矩阵
由于数据维度太大,我不得不将数据转换为
稀疏
矩阵,而不是密集数组。 然而,由于该图包含cnn,当我直接给
稀疏
矩阵喂入时,我被告知cnn不能接收
稀疏
张量。所以我得先做“
稀疏
到稠密”的操作。但问题是,我的数据(多
稀疏
矩阵)应该转换成二维
稀疏
矩阵。(例如,我有
稀疏
matrix1,dim为14,25500,
稀疏
matrix2,dim为14,25500,理想维数为2,14,25500,但我所面对的现实是28,25500),所以在进入图后,我不得不拆分张量
浏览 0
提问于2017-10-13
得票数 0
回答已采纳
1
回答
列切片和行切片之间是哪一个?
其中两种是列
稀疏
矩阵和行
稀疏
矩阵。所述列
稀疏
矩阵支持快速列切片操作,所述行
稀疏
矩阵支持快速行切片操作。 但我不是如果操作ai,:是列还是行切片操作。有什么帮助吗?
浏览 2
提问于2014-06-04
得票数 3
回答已采纳
第 2 页
第 3 页
第 4 页
第 5 页
第 6 页
第 7 页
第 8 页
第 9 页
第 10 页
第 11 页
点击加载更多
领券