首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >多GPU对等点在特定对间的慢速度

多GPU对等点在特定对间的慢速度
EN

Stack Overflow用户
提问于 2020-01-10 22:55:14
回答 1查看 471关注 0票数 0

我有8个RTX GPU。运行p2pBandwidthLatencyTest时,GPU0和GPU1、GPU2和GPU3、GPU4和GPU5、GPU6和GPU7之间的延迟比其他对慢40,000倍:

代码语言:javascript
复制
P2P=Enabled Latency (P2P Writes) Matrix (us)
   GPU     0      1      2      3      4      5      6      7 
     0   1.80 49354.72   1.70   1.70   1.74   1.74   1.74   1.72 
     1 49354.84   1.37   1.70   1.69   1.74   1.76   1.73   1.72 
     2   1.88   1.81   1.73 49355.00   1.79   1.76   1.76   1.75 
     3   1.88   1.79 49354.85   1.33   3.79   3.84   3.88   3.91 
     4   1.89   1.88   1.90   1.87   1.72 49354.96   3.49   3.56 
     5   2.30   1.93   1.88   1.89 49354.89   1.32   3.63   3.60 
     6   2.55   2.53   2.37   2.29   2.24   2.26   3.50 49354.77 
     7   2.30   2.27   2.29   1.87   1.82   1.83 49354.85   1.36 

将其与禁用点对点时进行比较:

代码语言:javascript
复制
P2P=Disabled Latency Matrix (us)
   GPU     0      1      2      3      4      5      6      7 
     0   1.80  14.31  13.86  13.49  14.52  13.89  13.58  13.58 
     1  13.71   1.82  14.44  13.95  14.65  13.62  15.05  15.20 
     2  13.38  14.23   1.73  16.59  13.77  15.44  14.10  13.64 
     3  12.68  15.62  12.50   1.77  14.92  15.01  15.17  14.87 
     4  13.51  13.60  15.09  13.40   1.27  12.48  12.68  19.47 
     5  14.92  13.84  13.42  13.42  16.53   1.30  16.37  16.60 
     6  14.29  13.62  14.66  13.62  14.90  13.70   1.32  14.33 
     7  14.26  13.42  14.35  13.53  16.89  14.26  17.03   1.36 

这是正常的吗?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-01-13 22:26:29

原来超慢的点对点是不正常的。

在BIOS中禁用IOMMU (Intel VT-d)之后,问题就消失了

代码语言:javascript
复制
P2P=Enabled Latency (P2P Writes) Matrix (us)
   GPU     0      1      2      3      4      5      6      7 
     0   1.34   1.22   1.68   1.69   1.71   1.70   1.75   1.73 
     1   1.20   1.38   1.70   1.67   1.71   1.75   1.75   1.72 
     2   1.69   1.67   1.29   1.20   1.73   1.75   1.75   1.75 
     3   1.69   1.66   1.17   1.29   1.74   1.75   1.72   1.73 
     4   1.72   1.76   1.74   1.70   1.32   1.13   1.66   1.70 
     5   1.74   1.73   1.75   1.74   1.18   1.28   1.67   1.69 
     6   1.75   1.74   1.74   1.72   1.67   1.68   1.31   1.19 
     7   1.76   1.75   1.73   1.73   1.67   1.69   1.18   1.32 

问题似乎与以下文件的讨论相同或非常类似:

讨论中提到了几个可能的解决办法:

禁用IOMMU:

禁用ACS:

我的系统只在BIOS中启用了IOMMU。当lspci -vvv | grep ACS什么也没有得到时,ACS没有打开。

==============================

I/O MMU背景:

https://en.wikipedia.org/wiki/X86_virtualization#I/O_MMU_virtualization_(AMD-Vi_and_Intel_VT-d)

它是x86虚拟化的一部分。这是由芯片组完成的虚拟化。除了IOMMU这个名字,它也叫AMD-Vi或Intel VT.不要与通过CPU虚拟化的AMD-V和Intel VT混为一谈.

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/59690008

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档