nvidia-smi系列命令,查看gpu,显存信息

nvidia-smi系列命令,查看gpu,显存信息
显卡包含gpu,显存,gpu不等于显存
nvidia-smi 的定义:
1. 基于 NVIDIA Management Library (NVIDIA 管理库),实现 NVIDIA GPU 设备的管理和监控功能
2. 主要⽀持 Tesla, GRID, Quadro 以及 TitanX 的产品,有限⽀持其他的 GPU 产品
龙婕物联流量卡所以我们在常见的 NVIDIAGPU 产品上安装完驱动后,都同时安装上 nvidia-smi 管理⼯具,帮助管理⼈员通过命令⾏的⽅式对 GPU 进⾏监控和管理。
当我们成功部署了 GRID 软件以后,我们可以通过以下 nvidia-smi 命令实现对 GPU 的管理。
nvidia-smi 会随着 GRID 软件不断的升级,⽽功能不断的丰富,所以当我们在执⾏⼀些复杂的 nvidia-smi 命令时,可能早期的 GRID 版本⽆法⽀持这些命令。
以下 nvidia-smi 常⽤命令⾏是个⼈推荐了解的:
nvidia-smi
恐龙危机1攻略
这是服务器上特斯拉 K80 的信息。
免疫组化sp法
上⾯的表格中:
第⼀栏的 Fan:N/A 是风扇转速,从 0 到 100% 之间变动,这个速度是计算机期望的风扇转速,实际情况下如果风扇堵转,可能打不到显⽰的转速。有的设备不会返回转速,因为它不依赖风扇冷却⽽是通过其他外设保持低温(⽐如我们实验室的服务器是常年放在空调房间⾥的)。
第⼆栏的 Temp:是温度,单位摄⽒度。
第三栏的 Perf:是性能状态,从 P0 到 P12,P0 表⽰最⼤性能,P12 表⽰状态最⼩性能。
第四栏下⽅的 Pwr:是能耗,上⽅的 Persistence-M:是持续模式的状态,持续模式虽然耗能⼤,但是在新的 GPU 应⽤启动时,花费的时间更少,这⾥显⽰的是 off 的状态。
第五栏的 Bus-Id 是涉及 GPU 总线的东西,domain:bus:device.function
第六栏的 Disp.A 是 Display Active,表⽰ GPU 的显⽰是否初始化。
第五第六栏下⽅的 Memory Usage 是显存使⽤率。
孔府宴酒破产拍卖第七栏是浮动的 GPU 利⽤率。
第⼋栏上⽅是关于 ECC 的东西。
第⼋栏下⽅ Compute M 是计算模式。
下⾯⼀张表⽰每个进程占⽤的显存使⽤率。
显存占⽤和 GPU 占⽤是两个不⼀样的东西,显卡是由 GPU 和显存等组成的,显存和 GPU 的关系有点类似于内存和 CPU 的关系。
nvidia-smi -q
查看当前所有 GPU 的信息,也可以通过参数 i 指定具体的 GPU。
⽐如 nvidia-smi-q -i 0 代表我们查看服务器上第⼀块 GPU 的信息。
通过 nvidia-smi -q 我们可以获取以下有⽤的信息:
GPU 的 SN 号、VBIOS、PN 号等信息:
可以参考
windows 上的使⽤
nvidia-smi 所在的位置为:
C:\Program Files\NVIDIA Corporation\NVSMI
cmd 进⼊⽬录输⼊命令即可:
nvidia-smi --help-query-gpu:
"al"
Total installed GPU memory.
"memory.used"
Total memory allocated by active contexts.
泰坦尼克船长再现"memory.free"
Total free memory.
nvidia-smi --query-gpu=al,memory.free,memory.used,name,utilization. --format=csv -l 5 nvidia-smi --format=csv,noheader,nounits --query-
gpu=timestamp,al,memory.used,memory.free,utilization. -lms 500 -f smi-1-90s-instance.log 计算程序运⾏时间段内平均显存使⽤情况
显存:显卡的存储空间。
nvidia-smi 查看的都是显卡的信息,⾥⾯memory是显存
top:
泥浆固液分离如果有多个gpu,要计算单个GPU,⽐如计算GPU0的利⽤率:
1 先导出所有的gpu的信息到 smi-1-90s-instance.log⽂件:
nvidia-smi --format=csv,noheader,nounits --query-
gpu=timestamp,al,memory.used,memory.free,utilization. -lms 500 -f smi-1-90s-instance.log 2 GPU0的全部数据,将第⼀个gpu的信息导出到test.log⾥⾯
awk  -F","  '{ if($2==0){print $0} } '  smi-1-90s-instance.log >> test.log
3 再cat smi-1-90s-instance.log | awk '{sum7+=$7;count++}END{print sum7/count}'
top;将动态刷新的信息写⼊到⽂件中
top  -d  0.5  -b|grep  hello|tee  -a  &
将动态产⽣的系统信息放⼊⽂件中

本文发布于:2024-09-20 17:33:34,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/532448.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:显存   风扇   转速   管理   信息   显卡   查看   服务器
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议