腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
搜索
关闭
文章
问答
(9999+)
视频
开发者手册
清单
用户
专栏
沙龙
全部问答
原创问答
Stack Exchange问答
更多筛选
回答情况:
全部
有回答
回答已采纳
提问时间:
不限
一周内
一月内
三月内
一年内
问题标签:
未找到与 相关的标签
筛选
重置
0
回答
GPUManager组件可以动态修改管控
GPU
显存和
算
力
吗?不重启pod情况下调整
算
力
规格?
gpu
不重启pod情况下调整
算
力
规格,即时生效
浏览 194
提问于2021-06-25
2
回答
混用云的解决方案有没有更多的代码或者示例?
云服务器
、
公有云
、
解决方案
本地云
算
力
和公有云
算
力
如何无缝衔接?
浏览 214
提问于2025-07-22
0
回答
大语言模型训练与推理算
力
如何成本估算?
并发
、
模型
大语言模型
算
力
成本估算,影响因素有哪些? 推理并发量、模型参数、输入和输出内容长度、推理响应时间。如何具体估算算
力
成本?
浏览 410
提问于2023-07-21
1
回答
库达内存带宽计算
我有几个有关cuda编程和
GPU
体系结构的问题要问:我不知道怎么
算
,谁能帮我,谢谢
浏览 1
提问于2018-03-20
得票数 1
回答已采纳
1
回答
OpenCL -多
GPU
缓冲区同步
我有一个OpenCL核,它计算系统中其他粒子施加在粒子上的总
力
,然后再计算另一个粒子的位置/速度。我想并行这些内核跨越多个
GPU
,基本上分配一定数量的粒子给每个
GPU
。但是,我必须多次运行这个内核,并且每个
GPU
的结果都在其他的
GPU
上使用。让我进一步解释一下: 假设
GPU
0上有0粒子,
GPU
1上有1粒子。粒子0上的
力
是变化的,粒子1上的
力
也是一样,然后积分器就相应地改变了它们的位置和速度。然后,这些新的位置需要放置在每
浏览 6
修改于2017-05-23
得票数 3
回答已采纳
1
回答
RNN的最佳设备放置策略?
考虑一个简单的n层堆叠RNN (LSTM、GRU等)对于顺序预测,最有效的设备放置策略是什么(如果有多个
GPU
可用)?我认为最好是为RNN的每一层提供一个
GPU
,但是softmax和损失计算呢?它们应该也放在
GPU
上还是放在CPU上?此外,如果我们再增加一个注意
力
机制,是否应该把注意
力
放在中央处理器上呢?
浏览 7
提问于2017-02-24
得票数 0
1
回答
使用GPUDirect总线的PCIe对等点:如果我需要访问其他
GPU
上的太多数据,它不会导致死锁吗?
我在
GPU
中加载数据以进行计算,数据中有很多依赖项。由于1个
GPU
对数据不够,所以我将其升级为2个
GPU
。但是限制是,如果我需要其他
GPU
上的数据,首先必须有一个副本来托管。那么,如果我使用
GPU
直接P2P,PCI总线会处理这么多的
GPU
之间的通信吗?会导致死锁吗? 我是新手,所以需要一些帮助和洞察
力
。
浏览 5
提问于2015-01-08
得票数 3
回答已采纳
1
回答
为什么这种深度学习模型在CPU上比
GPU
执行更快的推理?
本文作者: "",2016年有人会有洞察
力
吗?这是否也意味着,一般来说,在
GPU
上进行训练时,在CPU上执行神经网络的测试步骤更好?这是否也适用于仅在1个
GPU
上接受培训的模型,而不是多个
GPU
上的模型?
浏览 5
修改于2017-03-27
得票数 0
回答已采纳
1
回答
GPU
亲和性(
GPU
核心亲和性)
谁能告诉我为什么没有
GPU
亲和
力
(我指的是执行单元亲和
力
)?我知道在Opencl规范1.2中,我们有一种叫做设备分裂的东西,但据我所知,这只适用于CPU。谢谢
浏览 1
提问于2012-11-20
得票数 2
回答已采纳
1
回答
Excel解
算
器,
力
变量为非零
我需要使用Excel中的求解程序来最小化错误。优化器有一个选项“让无约束变量非负”,但是我需要这个变量也是非零变量。是否有一种方法可以告诉求解者永远不要尝试0值,这样它就不会在DIV/0错误中运行,或者告诉它在找到DIV/0值并继续迭代时不要中断。
浏览 4
提问于2022-02-16
得票数 -2
0
回答
有效的
算
符包括 +、-、?
对象
有效的
算
符包括 +、-、*、/ 。每个运算对象可以是整数,也可以是另一个逆波兰表达式。说明:整数除法只保留整数部分。给定逆波兰表达式总是有效的。
力
扣150。
浏览 283
提问于2021-10-17
1
回答
huggingface-transformers:训练BERT并使用不同的注意
力
对其进行评估
我正在尝试使用标准注意
力
训练,并使用不同的注意
力
定义进行评估。我正在考虑的操作是在以下命令中将bert-base-uncased更改为我训练过的模型的路径(使用标准注意
力
),并在我的自定义注意
力
版本的安装下运行--do_eval。TASK_NAME \ --data_dir $GLUE_DIR/$TASK_NAME \ --per_
gpu
_eval_batch_size=8 \ --
浏览 18
修改于2020-05-08
得票数 0
回答已采纳
2
回答
如何选择CPU和
GPU
进行公平比较?
我需要做一个有说服
力
的论证,一个好的
GPU
对于那些需要做某些计算并且可能愿意编写自己的代码来做这些计算的人来说是有价值的。我已经编写了CUDA代码,以便使用
GPU
快速完成计算,我想将其计算时间与仅使用CPU的版本进行比较。困难的部分是争辩说,我做了一个相当公平的比较,即使我不是在比较苹果。如何选择CPU和
GPU
才能使比较看起来合理?我最好的想法是选择CPU和
GPU
,价格差不多;有没有更好的方法?
浏览 1
提问于2012-08-27
得票数 0
1
回答
如何忽略特定列来计算softmax关注?
我想要计算注意
力
。注意
力
指示上下文中的哪些句子应该被关注。Before softmax.0.0000 0.0000 0.0000 348.0155 [torch.cuda.FloatTensor of size 15 (
浏览 2
修改于2018-02-05
得票数 1
1
回答
并行布鲁特
力
算法
GPU
我想在
GPU
上实现这种并行技术。应该像
GPU
上的并行BF生成器。在网上找不到任何例子让我怀疑。
浏览 1
修改于2019-02-10
得票数 1
回答已采纳
1
回答
如何从力矩和
力
向量反求位置或手臂矢量?
我有从
力
和臂矢量计算出的矩矢量。如何从M和F中反
算
'u‘?
浏览 2
提问于2022-06-09
得票数 0
回答已采纳
2
回答
利用
GPU
值得吗?
我一直在研究利用
GPU
的方法(例如CUDA),它们似乎对大N (20000)的模拟有利。这是有道理的,因为最昂贵的计算通常是求
力
。是否值得将此系统移植到
GPU
上? 根据的文章,对于不同的计算(如加速度和
力
),使用不同的内核似乎是有效的。
浏览 2
修改于2018-01-07
得票数 3
回答已采纳
1
回答
Intel GMA 3600 Linux支持
我正在与一个嵌入式板工作,其中包括英特尔Atom N2600处理器和
GPU
GMA 3600系列基于PowerVR SGX 545图形核心(由想象
力
开发) [Link1]。据我所知,英特尔只是通过Link2的驱动程序为其
GPU
提供Windows 7支持。在我的例子中,我是在Linux下工作的,所以我需要知道是否存在在启动X服务器时使用任何兼容的驱动程序启用
GPU
功能的可能性。 这不可能吗?
浏览 0
修改于2017-04-13
得票数 2
回答已采纳
2
回答
Xbox 360上的
GPU
编程
我正在寻找一些关于XNA在Xbox360上的洞察
力
,主要是如果有可能在它的
GPU
上运行基于向量的浮点数学? 如果有办法,你能告诉我正确的方向吗?
浏览 2
提问于2008-09-24
得票数 7
回答已采纳
3
回答
PhysX:关节摩擦/刚性关节
我想在关节上增加摩擦
力
,使它们变得“僵硬”。想象一下,一扇门(带有极其生锈的铰链)需要被踢几次才能打开--也就是说,它绕着铰链旋转,但旋转的次数不多,很快就会停止,需要很大的
力
才能使其旋转。另外,我在这里不是在谈论关节/解
算
器的不稳定性。碎布玩偶是稳定的(或多或少),关节遵守自由度(关节限制),但关节没有摩擦
力
,我想为它们添加摩擦
力
。
浏览 1
修改于2010-05-28
得票数 2
回答已采纳
第 2 页
第 3 页
第 4 页
第 5 页
第 6 页
第 7 页
第 8 页
第 9 页
第 10 页
第 11 页
点击加载更多
领券