首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >CUDA nvcc慢速主机代码

CUDA nvcc慢速主机代码
EN

Stack Overflow用户
提问于 2012-06-20 16:11:07
回答 1查看 991关注 0票数 3

我在使用nvcc编译器时遇到问题。我发现使用NVCC4.2编译的主机代码运行速度比使用g++ 4.4.6编译的相同代码慢5倍。我正在使用NVIDIA SDK Makefile模板来编译发布配置中的代码。在这两种情况下都使用了-O2优化。这怎么可能,因为nvcc应该将主机代码传递给主机编译器。有什么想法吗?

这是我的makefile:

代码语言:javascript
复制
# Add source files here
EXECUTABLE  := App
verbose=1
# C/C++ source files (compiled with gcc / c++)
CCFILES     := \
    cmdl.cpp main.cpp
# Cuda source files (compiled with cudacc)
CUFILES_sm_30       := AppCuda.cu AppHost.cpp 

# Do not link with CUTIL
OMIT_CUTIL_LIB := 1

################################################################################
# Rules and targets
ROOTDIR=/home/snpsyn/NVIDIA_GPU_Computing_SDK/C/common
include $(ROOTDIR)/../common/common.mk
EN

回答 1

Stack Overflow用户

发布于 2012-07-31 23:48:50

使用nvcc或g++ (CUDA compiler driver)编译c++代码应该没有区别

但请尝试直接使用g++编译所有c++代码。在您给出的示例中,AppHost.cpp文件被传递到nvcc,而不是g++。

如果你能提供源代码和makefile,那将会有很大帮助。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/11115343

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档