腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
搜索
关闭
文章
问答
(23)
视频
开发者手册
清单
用户
专栏
沙龙
全部问答
原创问答
Stack Exchange问答
更多筛选
回答情况:
全部
有回答
回答已采纳
提问时间:
不限
一周内
一月内
三月内
一年内
问题标签:
未找到与 相关的标签
筛选
重置
1
回答
没有cmake如何使用
cudpp
?
我需要使用
cudpp
的扫描功能。但是,
cudpp
需要cmake才能编译。有没有办法将
cudpp
的扫描功能直接转换成CUDA的C代码?如果是这样,我该怎么做呢?
浏览 2
修改于2013-02-11
得票数 0
1
回答
OpenMPI CUDA和
CUDPP
是否可以使用
CUDPP
。? 有没有人同时使用openmpi和
cudpp
?
浏览 3
提问于2012-04-24
得票数 2
回答已采纳
1
回答
推力vs
CUDPP
为了在带有CUDA的GPU上使用数据并行算法,有两个标准库
CUDPP
和sorting,它们实现了排序、归约、前缀求和等功能。 那么,就性能和功能而言,这两个库之间的主要区别是什么?
浏览 1
提问于2012-07-19
得票数 5
回答已采纳
1
回答
cuda.h和
cudpp
.h有什么区别?我使用的是4.2版本,
cudpp
不起作用。
cuda.h中的
cudpp
.h是否有相应的功能用于以下方面:cudppCreate(&theCudpp);config.op =
CUDPP
_ADD;config.algorithm =
CUDPP
_SCAN; config.options=
CUDPP
_OPTION_FORWARD |
CUDPP
_OPTION_E
浏览 5
修改于2013-12-05
得票数 0
回答已采纳
1
回答
使用
CUDPP
/推力的分段排序
是否可以在CUDA中使用
CUDPP
进行分段排序?通过分段排序,我的意思是对数组中受如下标志保护的元素进行排序。
浏览 0
修改于2012-10-21
得票数 1
1
回答
CUDA 4.2、Nsight 2.2中的Nsight调试实例的
CUDPP
2.0调试是否正确?
我已经将一个项目从CUDA 4.0,Nsight 2.0升级到CUDA 4.2,Nsight 2.2,在CUDA 4.2上重新编译
CUDPP
。#include <cassert>int main(int argc, char* argv[])#defined_auiOut; CUDP
浏览 0
提问于2012-08-09
得票数 0
1
回答
CUDPP
在排序上比推力更快?那么结构数组呢?
然后人们告诉我
CUDPP
排序更快,但我发现它不可能直接排序结构数组。你对更快的排序有什么建议吗?你还有其他方式做这项工作吗?
浏览 1
提问于2011-09-17
得票数 1
回答已采纳
2
回答
CUDA中的高性能前缀求和/扫描函数,寻找推力,
cuDPP
库替代
在推力失败后,我专注于
cuDPP
库,它曾经是CUDA工具包的一部分。
cuDPP
的性能非常好,但是库没有更新到最新的CUDA5.5,并且在使用内存检查器进行调试时,cudppMultiScan()函数中存在一些全局内存冲突问题。
浏览 4
提问于2013-09-02
得票数 6
1
回答
推力/
cudpp
中求第k最小元素的算法
我正在寻找推力/cudapp中的第k个最小元素算法的实现。我用谷歌搜索了一下,但似乎没有找到。有没有人知道有没有这样的算法?
浏览 3
修改于2011-12-28
得票数 0
1
回答
cudpp
是否仅适用于具有特定计算能力的设备?
我想用
cudpp
。我很好奇它是否只适用于具有一定计算能力的设备?如果是,下限是多少?
浏览 1
修改于2012-02-05
得票数 1
回答已采纳
1
回答
CUDAPP1.1 cudppSort配置错误(配置参数无效)
我使用以下代码来设置排序算法:config.op =
CUDPP
_ADD;config.algorithm=
CUDPP
_SORT_RADIX; config.options =
CUDPP
_OPTION_KEY_VALUE_PAIRS |
CUDPP
_OPTION_FORWARD |
CUDPP
_OPTION_EXCLUSIVECUDPPHandle planHandl
浏览 0
提问于2009-10-08
得票数 1
回答已采纳
1
回答
cudaGetDeviceProperties是否返回损坏的信息?
以下代码片段具有crashing ()辅助函数:{#include "
cudpp
/
cudpp
.h" }}下面是相关的类代码:#include "
cudpp
/
cudpp
.h"} protec
浏览 0
修改于2012-07-26
得票数 2
回答已采纳
1
回答
当输入数据大小大于700,000时,cudppscan输出错误
cudaMemcpyHostToDevice)); CUDPPHandle scanplan; config.datatype =
CUDPP
_INT; config.options=
CUDPP
_OPTION_FORWARD |
CUDPP
_OPTION_I
浏览 2
提问于2011-07-25
得票数 1
1
回答
CUBLAS库:查找实际值的最大值,而不是绝对值
这意味着我不能使用推力/
cudpp
,而且我只能使用一个旧版本的CUBLAS。
浏览 0
修改于2013-03-13
得票数 2
回答已采纳
1
回答
CUDA中的Hashmap数据结构
CUDPP
很酷,但是它不能满足我的要求,因为我希望我的键是固定大小的int数组。我需要通过大小10k+的键值存储每秒查询1M+。是否有任何库已经提供这种类型的功能。
浏览 4
提问于2016-03-15
得票数 2
回答已采纳
2
回答
GPU上的并行冒泡排序
另请注意,我知道我可以实现更好的排序算法,我可以使用推力、
CUDPP
或SDK中的示例排序算法,但在我的情况下,我只需要一个简单的算法来实现。
浏览 3
修改于2012-08-08
得票数 3
回答已采纳
1
回答
库达流压缩:理解概念
我正在使用CUDA/Thrust/
CUDPP
。据我所知,在流压缩中,数组中的某些项被标记为无效,然后“删除”。 现在“移除”到底是什么意思?假设原始数组A的长度为6。
浏览 2
提问于2011-12-05
得票数 5
2
回答
在CUDA项目中使用C++
考虑到我正在处理矩阵,我不能使用
CUDPP
,所以,虽然我避免了它,但我将不得不使用推力库(我对C++一无所知)。
浏览 1
提问于2011-05-20
得票数 1
回答已采纳
7
回答
Python GPU编程
看起来我只局限于编写低级的CUDA或openCL内核;没有推力,就没有
cudpp
。如果我想把东西整理好,我就得自己做了。 这对我来说似乎不太对。我是不是真的漏掉了什么?
浏览 3
修改于2011-05-11
得票数 54
1
回答
CUDA中共享内存的并行扫描
我检查了推力和
CudPP
,但它们都只在数据最初在全局内存中时工作,这不是我想要的,因为我不想启动一个新内核来做很少的工作,然后将数据复制回全局内存,因为它有相当大的开销。
浏览 3
修改于2015-02-06
得票数 4
回答已采纳
第 2 页
领券