NvidiaGPU风扇和电源显示ERR!解决办法

NvidiaGPU风扇和电源显⽰ERR!解决办法神狐海域
训练模型时,风扇异常响,然后输⼊nvidia-smi发现风扇异常如下图(⽹上的图)
在有⼈给出了解决⽅案,即问题的根源可能是风扇转速不⾜使GPU过热导致的。
⾸先开启GPU的persistent mode,再设置风扇的功率重启即可⽣效。其中200代表的是风扇的最⼤功率限制,可以将其设置为最⼤,这样过热的时候风扇就会⾃动加⼤功率。
sudo nvidia-smi -pm 1
sudo nvidia-smi -pl 200 -i 1 # 最⾼250,指定运⾏的1卡最⾼功率为200,从⽽降低发热变线人生
⼿动风扇控制
solf>金相组织分析此外,还可以将GPU风扇的⼿动风速控制打开。⽅法为:
⾸先,使⽤sudo nvidia-xconfig --enable-all-gpus命令打开所有gpu在xserver中的设置(不使⽤sudo可能⽆权限写⼊新配置)
然后修改配置⽂件:sudo vim /etc/f,在其中的DeviceSection中加⼊Option "Coolbits" "4"
如下图所⽰:
如果机器上有多块gpu,在第⼀步命令执⾏后,会在这个f中出现多个Device Section,都依次执⾏第三步操作。重启机器后,命令⾏执⾏nvidia-settings,会打开设置界⾯,在其中的会显⽰所有GPU的设置选项,每个GPU控制选项下⾯都有⼀个Thermal settings,进⼊后打开enable GPU Fan Setting即可对风扇进⾏⼿动风速调整了。刘莎莎全套
>xscale

本文发布于:2024-09-23 02:26:03,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/532465.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:风扇   功率   可能   重启   控制   风速
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议