搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

0回答

GPUManager组件可以动态修改管控GPU显存和算力吗？不重启pod情况下调整算力规格？

gpu

不重启pod情况下调整算力规格，即时生效

浏览 194提问于2021-06-25

2回答

混用云的解决方案有没有更多的代码或者示例？

云服务器、公有云、解决方案

本地云算力和公有云算力如何无缝衔接？

浏览 214提问于2025-07-22

0回答

大语言模型训练与推理算力如何成本估算？

并发、模型

大语言模型算力成本估算，影响因素有哪些？推理并发量、模型参数、输入和输出内容长度、推理响应时间。如何具体估算算力成本？

浏览 410提问于2023-07-21

1回答

库达内存带宽计算

我有几个有关cuda编程和GPU体系结构的问题要问：我不知道怎么算，谁能帮我，谢谢

浏览 1提问于2018-03-20得票数 1

回答已采纳

1回答

我有一个OpenCL核，它计算系统中其他粒子施加在粒子上的总力，然后再计算另一个粒子的位置/速度。我想并行这些内核跨越多个GPU，基本上分配一定数量的粒子给每个GPU。但是，我必须多次运行这个内核，并且每个GPU的结果都在其他的GPU上使用。让我进一步解释一下：假设GPU 0上有0粒子，GPU 1上有1粒子。粒子0上的力是变化的，粒子1上的力也是一样，然后积分器就相应地改变了它们的位置和速度。然后，这些新的位置需要放置在每

浏览 6修改于2017-05-23得票数 3

回答已采纳

1回答

RNN的最佳设备放置策略？

考虑一个简单的n层堆叠RNN (LSTM、GRU等)对于顺序预测，最有效的设备放置策略是什么(如果有多个GPU可用)？我认为最好是为RNN的每一层提供一个GPU，但是softmax和损失计算呢？它们应该也放在GPU上还是放在CPU上？此外，如果我们再增加一个注意力机制，是否应该把注意力放在中央处理器上呢？

浏览 7提问于2017-02-24得票数 0

1回答

使用GPUDirect总线的PCIe对等点:如果我需要访问其他GPU上的太多数据，它不会导致死锁吗？

我在GPU中加载数据以进行计算，数据中有很多依赖项。由于1个GPU对数据不够，所以我将其升级为2个GPU。但是限制是，如果我需要其他GPU上的数据，首先必须有一个副本来托管。那么，如果我使用GPU直接P2P，PCI总线会处理这么多的GPU之间的通信吗？会导致死锁吗？我是新手，所以需要一些帮助和洞察力。

浏览 5提问于2015-01-08得票数 3

回答已采纳

1回答

为什么这种深度学习模型在CPU上比GPU执行更快的推理？

本文作者： ""，2016年有人会有洞察力吗？这是否也意味着，一般来说，在GPU上进行训练时，在CPU上执行神经网络的测试步骤更好？这是否也适用于仅在1个GPU上接受培训的模型，而不是多个GPU上的模型？

浏览 5修改于2017-03-27得票数 0

回答已采纳

1回答

GPU亲和性(GPU核心亲和性)

谁能告诉我为什么没有GPU亲和力(我指的是执行单元亲和力)？我知道在Opencl规范1.2中，我们有一种叫做设备分裂的东西，但据我所知，这只适用于CPU。谢谢

浏览 1提问于2012-11-20得票数 2

回答已采纳

1回答

Excel解算器，力变量为非零

我需要使用Excel中的求解程序来最小化错误。优化器有一个选项“让无约束变量非负”，但是我需要这个变量也是非零变量。是否有一种方法可以告诉求解者永远不要尝试0值，这样它就不会在DIV/0错误中运行，或者告诉它在找到DIV/0值并继续迭代时不要中断。

浏览 4提问于2022-02-16得票数 -2

0回答

有效的算符包括 +、-、？

对象

有效的算符包括 +、-、*、/ 。每个运算对象可以是整数，也可以是另一个逆波兰表达式。说明：整数除法只保留整数部分。给定逆波兰表达式总是有效的。力扣150。

浏览 283提问于2021-10-17

1回答

huggingface-transformers:训练BERT并使用不同的注意力对其进行评估

我正在尝试使用标准注意力训练，并使用不同的注意力定义进行评估。我正在考虑的操作是在以下命令中将bert-base-uncased更改为我训练过的模型的路径(使用标准注意力)，并在我的自定义注意力版本的安装下运行--do_eval。TASK_NAME \ --data_dir $GLUE_DIR/$TASK_NAME \ --per_gpu_eval_batch_size=8 \ --

浏览 18修改于2020-05-08得票数 0

回答已采纳

2回答

如何选择CPU和GPU进行公平比较？

我需要做一个有说服力的论证，一个好的GPU对于那些需要做某些计算并且可能愿意编写自己的代码来做这些计算的人来说是有价值的。我已经编写了CUDA代码，以便使用GPU快速完成计算，我想将其计算时间与仅使用CPU的版本进行比较。困难的部分是争辩说，我做了一个相当公平的比较，即使我不是在比较苹果。如何选择CPU和GPU才能使比较看起来合理？我最好的想法是选择CPU和GPU，价格差不多；有没有更好的方法？

浏览 1提问于2012-08-27得票数 0

1回答

如何忽略特定列来计算softmax关注？

我想要计算注意力。注意力指示上下文中的哪些句子应该被关注。Before softmax.0.0000 0.0000 0.0000 348.0155 [torch.cuda.FloatTensor of size 15 (

浏览 2修改于2018-02-05得票数 1

1回答

并行布鲁特力算法GPU

我想在GPU上实现这种并行技术。应该像GPU上的并行BF生成器。在网上找不到任何例子让我怀疑。

浏览 1修改于2019-02-10得票数 1

回答已采纳

1回答

如何从力矩和力向量反求位置或手臂矢量？

我有从力和臂矢量计算出的矩矢量。如何从M和F中反算'u‘？

浏览 2提问于2022-06-09得票数 0

回答已采纳

2回答

利用GPU值得吗？

我一直在研究利用GPU的方法(例如CUDA)，它们似乎对大N (20000)的模拟有利。这是有道理的，因为最昂贵的计算通常是求力。是否值得将此系统移植到GPU上？根据的文章，对于不同的计算(如加速度和力)，使用不同的内核似乎是有效的。

浏览 2修改于2018-01-07得票数 3

回答已采纳

1回答

Intel GMA 3600 Linux支持

我正在与一个嵌入式板工作，其中包括英特尔Atom N2600处理器和GPU GMA 3600系列基于PowerVR SGX 545图形核心(由想象力开发) [Link1]。据我所知，英特尔只是通过Link2的驱动程序为其GPU提供Windows 7支持。在我的例子中，我是在Linux下工作的，所以我需要知道是否存在在启动X服务器时使用任何兼容的驱动程序启用GPU功能的可能性。这不可能吗？

浏览 0修改于2017-04-13得票数 2

回答已采纳

2回答

Xbox 360上的GPU编程

我正在寻找一些关于XNA在Xbox360上的洞察力，主要是如果有可能在它的GPU上运行基于向量的浮点数学？如果有办法，你能告诉我正确的方向吗？

浏览 2提问于2008-09-24得票数 7

回答已采纳

3回答

PhysX:关节摩擦/刚性关节

我想在关节上增加摩擦力，使它们变得“僵硬”。想象一下，一扇门(带有极其生锈的铰链)需要被踢几次才能打开--也就是说，它绕着铰链旋转，但旋转的次数不多，很快就会停止，需要很大的力才能使其旋转。另外，我在这里不是在谈论关节/解算器的不稳定性。碎布玩偶是稳定的(或多或少)，关节遵守自由度(关节限制)，但关节没有摩擦力，我想为它们添加摩擦力。

浏览 1修改于2010-05-28得票数 2

回答已采纳

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

GPUManager组件可以动态修改管控GPU显存和算力吗？不重启pod情况下调整算力规格？

混用云的解决方案有没有更多的代码或者示例？

大语言模型训练与推理算力如何成本估算？

库达内存带宽计算

OpenCL -多GPU缓冲区同步

RNN的最佳设备放置策略？

使用GPUDirect总线的PCIe对等点:如果我需要访问其他GPU上的太多数据，它不会导致死锁吗？

为什么这种深度学习模型在CPU上比GPU执行更快的推理？

GPU亲和性(GPU核心亲和性)

Excel解算器，力变量为非零

有效的算符包括 +、-、？

huggingface-transformers:训练BERT并使用不同的注意力对其进行评估

如何选择CPU和GPU进行公平比较？

如何忽略特定列来计算softmax关注？

并行布鲁特力算法GPU

如何从力矩和力向量反求位置或手臂矢量？

利用GPU值得吗？

Intel GMA 3600 Linux支持

Xbox 360上的GPU编程

PhysX:关节摩擦/刚性关节

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐