我正在使用NVIDIA的命令行Visual Profiler nvprof评测tensorflow GPU应用程序,其中一个启动的内核在评测过程中非常活跃,它叫做redzone_checker?我在互联网上找不到任何关于这意味着什么的有用信息……
任何帮助或提示都将不胜感激。
发布于 2020-08-22 21:19:32
redzone_checker内核是在TensorFlow (v2.3.0) https://github.com/tensorflow/tensorflow/blob/master/tensorflow/stream_executor/gpu/redzone_allocator.cc行138中实现的
根据代码中的注释,redzone_checker内核检查input_buffer中的每个字节是否等于redzone_pattern。
对于不确定的信息,我很抱歉,我猜( redzone )这个术语来自于redzone的内存保护。堆栈或全局对象周围的红色区域,用于检测溢出和下溢。
我使用了nvprof (带--print-gpu-trace选项) mnist示例(https://www.tensorflow.org/xla)和XLA JIT编译两种情况进行了分析。使用XLA JIT编译时,redzone_checker调用只显示在mnist中,但在其他概要结果中没有redzone_checker调用。
我的结论是,对TensorFlow提供的内核进行修改(甚至通过XLA编译器进行优化)会导致调用redzone_checker来保护内存。
发布于 2021-03-05 08:17:29
你可以试试redzone/cuda?eed=0.575x
frame= 248 fps= 55 q=31.0 size= 256kB time=00:00:02.69 bitrate= 778.7kbits/s speed=0.592x
frame= 268 fps= 53 q=31.0 size= 256kB time=00:00:03.04 1https://stackoverflow.com/questions/60825444
复制相似问题