我有几个有关cuda编程和GPU体系结构的问题要问:
1.假定GPU的内存带宽为144 Gb/s,PCIe总线带宽为2.25GB/s,那么将一个100,000,000倍的数组传输到GPU需要多少毫秒?
2.考虑到GPU全局内存的大小为3Gb,您可以处理的最大数组大小是多少?如果你必须处理一个更长的数组,你怎么能改变你的程序来完成这个任务呢?
我不知道怎么算,谁能帮我,谢谢
发布于 2018-03-20 17:08:04
bandwidthTest数据自动化系统示例代码测量您的传输速度(可能)。请注意,要在应用程序中获得峰值传输吞吐量,通常需要向/从固定分配传输(<-提示,单击和读取)。double数量占用8个字节的存储空间。可以使用C库sizeof()函数来发现这一点。将可用内存大小除以元素大小后,您将得到可以存储在该内存量中的元素总数。实际可行的数额将略低于估计数。https://stackoverflow.com/questions/49378903
复制相似问题