nvidia smi显示250 W的功耗小于100 W,GPU利用率为100%.电力消耗不应该更接近GPU的使用吗?怎么解释呢?
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 410.73 Driver Version: 410.73 CUDA Version: 10.0 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
|===============================+======================+======================|
| 0 GeForce GTX 108... Off | 00000000:01:00.0 On | N/A |
| 54% 71C P2 90W / 250W | 10922MiB / 11175MiB | 100% Default |
+-------------------------------+----------------------+----------------------+
| 1 GeForce GTX 108... Off | 00000000:02:00.0 Off | N/A |
| 45% 64C P2 99W / 250W | 10377MiB / 11178MiB | 100% Default |
+-------------------------------+----------------------+----------------------+发布于 2018-11-15 17:25:01
GPU-Util并不打算代表GPU的全部处理能力.
在接下来的10分钟里,有两个人在锻炼。一个锻炼者决定走路,另一个锻炼者决定跑步。他们都很忙,所以两个练习者都表示“人然而,哪一个运动者消耗更多的能量?跑步者消耗更多的能量,因此跑步者可能在90% W,步行者可能只消耗30% W。
如果你的GPU-Util显示65%,这意味着每100万个时钟周期中有65万个正在被使用,但这并不意味着它在运行的65万个时钟周期中以最大容量运行。
这是相同的100%或任何其他百分比。即使您的GPU-Util显示100%的使用率,它只意味着100万个时钟周期中有100万是繁忙的,但是它可能只使用简单的计算,或者在每个时钟周期中使用少量的计算。
发布于 2018-11-15 18:24:39
另一种解释:功耗值从GPU使用延迟到0.5秒。连续的nvidia-smi呼叫显示,平均GPU利用率与平均功耗是一致的。
$ while true ; do nvidia-smi | grep 10922MiB ; sleep .2 ; done
| 54% 71C P2 92W / 250W | 10922MiB / 11175MiB | 100% Default |
| 54% 70C P2 90W / 250W | 10922MiB / 11175MiB | 100% Default |
| 55% 70C P2 254W / 250W | 10922MiB / 11175MiB | 100% Default |
| 54% 72C P2 155W / 250W | 10922MiB / 11175MiB | 99% Default |
| 54% 70C P2 79W / 250W | 10922MiB / 11175MiB | 0% Default |
| 54% 72C P2 193W / 250W | 10922MiB / 11175MiB | 87% Default |
| 54% 71C P2 97W / 250W | 10922MiB / 11175MiB | 100% Default |
| 54% 70C P2 95W / 250W | 10922MiB / 11175MiB | 100% Default |
| 54% 71C P2 233W / 250W | 10922MiB / 11175MiB | 99% Default |
| 54% 71C P2 74W / 250W | 10922MiB / 11175MiB | 92% Default |
| 54% 70C P2 78W / 250W | 10922MiB / 11175MiB | 0% Default |
| 54% 71C P2 156W / 250W | 10922MiB / 11175MiB | 77% Default |
| 54% 71C P2 82W / 250W | 10922MiB / 11175MiB | 100% Default |
| 54% 71C P2 264W / 250W | 10922MiB / 11175MiB | 100% Default |
| 54% 72C P2 82W / 250W | 10922MiB / 11175MiB | 99% Default |
| 54% 70C P2 74W / 250W | 10922MiB / 11175MiB | 6% Default |
| 54% 70C P2 73W / 250W | 10922MiB / 11175MiB | 4% Default |
| 54% 71C P2 207W / 250W | 10922MiB / 11175MiB | 100% Default |
| 54% 71C P2 109W / 250W | 10922MiB / 11175MiB | 100% Default |
| 54% 70C P2 91W / 250W | 10922MiB / 11175MiB | 100% Default |
| 54% 70C P2 134W / 250W | 10922MiB / 11175MiB | 100% Default |
| 54% 72C P2 260W / 250W | 10922MiB / 11175MiB | 98% Default |
| 54% 70C P2 79W / 250W | 10922MiB / 11175MiB | 64% Default |
| 54% 71C P2 205W / 250W | 10922MiB / 11175MiB | 92% Default |
| 54% 71C P2 96W / 250W | 10922MiB / 11175MiB | 100% Default |https://stackoverflow.com/questions/53324467
复制相似问题