我有一个CUDA c++代码,我在这个代码中使用OpenCV做了一些操作。
nvcc file.cu -o o2 `pkg-config --libs --cflags opencv4我想知道哪个nvcc优化标志会是最好的,有效的和有用的?提前谢谢。
发布于 2022-01-07 16:56:41
这里有文档 for nvcc。
还有命令行帮助(nvcc --help).
您可以在这两个资源中找到有关优化和切换的信息。
您不应该需要任何额外的标志才能从获得最快的设备代码(不要指定-G)。对于主机代码优化,您可能希望尝试-O3。
https://stackoverflow.com/questions/70619926
复制相似问题