数据自动化系统11 特写公告,据说现在有:
新的链路时间优化功能
nvcc实际使用了哪些链路时间优化(例如,相对于主机端代码中带有g++或clang++的LTO功能)?
另外,是否需要做些什么才能启用LTO,还是总是发生这种情况(与需要使用-flto交换机进行编译的主机端代码不同)?
发布于 2021-02-24 12:20:08
部分答复:
若要启用链接时间优化,请在调用NVCC编译器时使用--dlink-time-opt (或dlto),用于编译和设备端代码链接。如果编译器找不到相关的中间信息,则不会(链接时间)优化.
发布于 2021-12-06 23:29:18
我的猜测是,-dlto必须具有编译时间和链接时间,如果您使用非nvcc(例如gcc或g++ )链接程序,则可能无法获得最佳性能。
https://stackoverflow.com/questions/66350310
复制相似问题