我正在做一个关于GPU上的CUDA加速的项目,并在我的计算中完成了一些软件级的优化,我还发现GPU架构中的一些变化可能会进一步帮助项目的优化。
现在我的问题是,是否有一种有效的方法或现有的仿真器可以让我更改GPU架构中的一些功能或部件,然后我可以在该定制架构上对CUDA PTX代码进行基准测试,以获得性能结果(最好是周期准确的)?有几个GPU的架构模拟器,所以我想知道其中是否有一些可能支持GPU?或者我可能不得不写一个GPU模拟器myself^_^?
发布于 2012-11-21 17:55:28
您正在寻找的正是GPGPU-sim。该模拟器准确地对NVIDIA GPU进行建模,无需在代码中修改即可执行OpenCL和CUDA工作负载。我猜也有一些选项可以对PTX工作负载进行建模。来自manual
GPGPU SIM3.x运行由
部分和GPU部分组成的程序二进制文件。然而,GPGPU-Sim 3.x中的微体系结构(计时)模型报告GPU繁忙的周期-它既不建模CPU计时,也不建模PCI Express计时(即CPU和GPU之间的内存传输时间)。
GPGPU-sim具有广泛的可配置性,允许您对不同的微体系结构进行建模。例如,您可以调整SMs、warp调度器、SIMD组、每个SM的线程数、共享内存大小、寄存器文件大小以及手册中说明的许多其他参数。在模拟结束时,模拟器转储执行持续时间(以GPU时钟周期为单位)和许多其他性能计数器。
更多信息:
GPU Ocelot是一种PTX分析仪。在以前的版本中,您可以模拟工作负载。然而,最近的版本侧重于PTX代码的编译器优化。
MacSim是另一个复杂而又强大的工具,用于模拟中央处理器和图形处理器的异构系统。
https://stackoverflow.com/questions/13488763
复制相似问题