腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
搜索
关闭
文章
问答
(9999+)
视频
开发者手册
清单
用户
专栏
沙龙
全部问答
原创问答
Stack Exchange问答
更多筛选
回答情况:
全部
有回答
回答已采纳
提问时间:
不限
一周内
一月内
三月内
一年内
问题标签:
未找到与 相关的标签
筛选
重置
2
回答
网络
开关盒距480 V
变压器
的距离
我正在为一家制造工厂做
网络
布局,遇到了一个我不熟悉的情况。我们有
6
个钢梁从地面到天花板,我们正在计划安装开关箱,其中将包括一个UPS和一个美拉基MS120-48P。其中一根横梁将包含一个480 V的
变压器
,用于一些制造设备,这正是我计划安装一个开关盒的那根电杆。到目前为止,开关箱将在
变压器
上方5-
6
英尺的地方。这会对
网络
交换机造成任何干扰吗?
浏览 0
提问于2020-02-24
得票数 2
回答已采纳
2
回答
如何预测神经机器翻译中的<unk>标记
例如,如果我有单词MKIK或"牛逼“(这是人工创建的),我们如何告诉神经
网络
(
变压器
模型)保持相同的输出? 问题是如何在整流罩上使用
变压器
模型。我发现fairseq有--replace-unk参数,但是它似乎不适用于
变压器
模型,或者它有一个错误
浏览 23
修改于2022-09-26
得票数 0
3
回答
什么是测试
变压器
架构的好玩具问题?
我正在测试
变压器
和
变压器
架构的各种变体。但是,关于全语言任务的培训是一件很费时的事情。什么是好的玩具问题,以测试
变压器
(或其中的替代)是否正在工作?理想情况下,这些问题应该发挥
变压器
的优势,但对于一个完全连接的前馈
网络
来说,这是很难解决的。那些只适用于注意力层的任务也是有用的。
浏览 0
修改于2021-06-07
得票数 5
1
回答
变压器
无反馈
关于
变压器
的新问题。图1(右下角)表示:“输出(右移)”。在我看来,在生成(而不是训练)期间,
网络
的第n输出似乎是通过消耗n-1输出来计算的,可能还包括更早的输出条目。我的理解正确吗? 如果是这样的话,那将是一个反馈,不是吗?但是为什么说
变压器
是前馈的呢?说
变压器
在发电时有反馈是正确的吗?
浏览 0
修改于2022-03-08
得票数 0
3
回答
以太网磁
变压器
的用途是什么,它们是如何使用的?
有人告诉我,当传输通过长电缆传输时,以太网磁
变压器
被用于基本的以太网。
变压器
的用途是什么?(是用于信号滤波还是增强?)很抱歉,如果我的问题不连贯,因为我不太熟悉以太网硬件。是不是所有的差分对(DA: pins 1& 2,DB: pins 3&
6
,DC: pins 4& 5,DD: pins 8和7)都是总线
浏览 0
修改于2016-04-25
得票数 13
1
回答
“伯特模型的微调”指的是什么?
或者我们只是用新的数据来训练顶级的几个
变压器
层。 提前感谢!
浏览 1
修改于2021-06-01
得票数 1
1
回答
变压器
的反向传播
当一个
变压器
模型被训练时,在解码器的末端有线性层,我的理解是一个完全连接的神经
网络
。在
变压器
模型训练过程中,当有损耗时,会反向传播来调整权值。还是将其扩展到所有解码器层权重矩阵(Q、K、V)和前向层权重?请帮我回答这个问题。
浏览 0
提问于2021-02-05
得票数 2
回答已采纳
1
回答
时间序列异常检测
我实现了
变压器
神经
网络
,我很困惑,怎么才能像其他神经
网络
体系结构那样在
变压器
中增加更多的层呢?
浏览 0
修改于2021-09-02
得票数 0
2
回答
GPT块和
变压器
解码器块有什么区别?
我知道GPT是一个基于
变压器
的神经
网络
,由几个模块组成.这些块是基于原来的转换器的解码块,但它们完全相同吗?在原有的
变压器
模型中,解码器块有两种注意机制:一种是纯多头自关注机制,另一种是对编码器输出的自我注意机制。在GPT中没有编码器,因此我假设它的块只有一个注意机制。这就是我发现的主要区别。(就像
变压器
解码器一样。) 是这样吗?GPT (1,2,3,.)之间的差异还有什么可补充的吗?原来的
变压器
呢?
浏览 0
提问于2020-11-16
得票数 5
回答已采纳
1
回答
多头专注是否消除了自我关注的需要?
标题可能令人困惑,但假设我要用一个利用多头注意力的掩蔽
网络
来构建
变压器
神经
网络
(就像SepFormer中的那样),那么在编码器和解码器中添加自我注意是否仍然是必要的?
浏览 0
修改于2021-04-12
得票数 3
回答已采纳
1
回答
何时使用分层规范/批处理规范?
当你设计一个
网络
时,你应该把规范化连接到哪里?例如,如果你有一个堆叠的
变压器
或注意力
网络
,在你有一个密集的层之后,在任何时候正常化是否有意义?
浏览 0
提问于2019-06-11
得票数 2
1
回答
如何用模型参数的数量来计算所需的标度?
我想知道训练这样大小的
变压器
需要什么样的计算量。难道这仅仅是~10^3倍的失败吗? 一般来说,如何计算
变压器
、神经
网络
、CNN和其他流行的深度学习模型的模型参数所需的尺度?
浏览 0
提问于2022-06-28
得票数 1
2
回答
变压器
与特征选择和常规机器学习有什么不同?
这也许是一种简单的思维方式,但对我来说,
变压器
(基于注意力的神经
网络
)只关注输入的一个子集,学习什么对问题/预测是重要的随着训练的进行。 这与常规特征选择和神经
网络
在输入子集上的训练有什么不同?
浏览 0
提问于2022-09-26
得票数 1
1
回答
在伯特的
变压器
编解码器的输入是什么?
对于学习蒙面语言模型(完形任务),论文指出15%的标记被蒙面,
网络
被训练来预测掩蔽标记。既然是这样的话,
变压器
编码器和解码器的输入是什么?此外,如何计算输出损失?这是只适用于蒙面地点的软件吗?为此,所有蒙面令牌都使用相同的线性层吗?
浏览 3
提问于2020-02-24
得票数 7
回答已采纳
1
回答
如何在PyTorch中计算大型神经
网络
的Hessian值?
如何在PyTorch中计算大型神经
网络
或
变压器
模型的Hessian矩阵?我知道torch.autograd.functional.hessian,但它似乎只计算函数的Hessian,而不是神经
网络
。问题是,我想计算关于权值的Hessian函数,但是对于大型神经
网络
来说,把它写成权值的函数是非常低效的。有更好的方法吗?如有任何建议,将不胜感激。谢谢。
浏览 24
提问于2022-03-14
得票数 2
1
回答
最优树遍历算法Topcoder
你把问题隔离到复杂建筑下面的下水道
网络
中,在管道迷宫的每一个交界处都有一个升级
变压器
。在恢复电源之前,必须检查每台
变压器
是否正常运行,必要时予以固定。更糟糕的是,下水道被布置成一棵树,树根位于下水道
网络
的入口处。这意味着,为了从一个
变压器
到下一个
变压器
,将有许多回溯通过长期和幽闭恐惧症的管道,因为没有捷径之间的连接。此外,这是一个星期天,你只有一个值班的技术人员在下水道
网络
中搜索坏的
变压器
。考虑一下您的技术员检查/修理
变压器
浏览 0
修改于2016-01-20
得票数 3
1
回答
无法安装句子
变压器
,出错
pip3安装-U语句转换器错误:无法安装句子-
变压器
=0.1.0,语句-
变压器
=0.2.0,语句-
变压器
=0.2.1,句子-
变压器
=0.2.2,语句-
变压器
=0.2.4,语句-
变压器
=0.2.4.1,语句-
变压器
=0.2.5,语句-
变压器
=0.2.5.1,句子-
变压器
=0.2.6.1,句子-
变压器
=0.2.6.2,句子-
变压器
=0.3.1,句子-
变压器
=0.3.2,句子
浏览 10
提问于2022-02-11
得票数 1
1
回答
如何将卷积特征编码器的Wav2Vec 2.0输出作为
变压器
上下文
网络
的输入
我正在阅读Wav2Vec 2.0论文并试图理解模型的体系结构,但我很难理解可变长度的音频原始输入是如何通过模型提供的,特别是从卷积特性编码器到
变压器
上下文
网络
。然而,
变压器
上下文
网络
有一个固定的输入维;基本的Wav2Vec 2.0模型使用模型维度768的转换器。这意味着,从卷积特征编码器的输出必须以某种方式“操纵”成为维度768,以便输入
变压器
。,Wav2Vec2FeatureExtractor)和互感器上下文
网络
(即.k.a.,Wav2Vec2Encoder)之间存在一个Wav2Vec
浏览 0
提问于2021-04-14
得票数 1
1
回答
torch.nn.MultiheadAttention是否包含标准化层和前馈层?
我想知道这个模块是否只包含注意部分而不是整个
变压器
块(即它不包含正常化层、剩余连接和附加的前馈神经
网络
)?
浏览 5
提问于2022-01-06
得票数 0
回答已采纳
1
回答
PySpark余弦相似
变压器
|+-------------+------------+ 如果这是正确的方法,而且没有这样的
变压器
,你能给我一个如何写自己的指针吗?
浏览 0
提问于2019-08-07
得票数 0
回答已采纳
第 2 页
第 3 页
第 4 页
第 5 页
第 6 页
第 7 页
第 8 页
第 9 页
第 10 页
第 11 页
点击加载更多
领券