$ loading_
获取 NVIDIA GPU 利用率、显存、温度与功耗等监控指标,支持 MIG 环境。
复制安装指令,让 AI 自动完成配置 · 推荐新手
"GPU MCP Server" 暂无可直接复制的安装信息,请查看页面文档或源码仓库。
读取当前服务器上所有 NVIDIA GPU 的利用率、显存占用、温度和功耗,并按 GPU 编号整理为表格。
一份按 GPU 编号汇总的监控表,展示各项核心指标。
列出这台机器上的 MIG 实例及其对应的 GPU 资源使用情况,包括显存占用和利用率,并标记异常偏高的实例。
一份 MIG 实例级别的资源使用清单,并指出可能异常的实例。
检查所有 GPU 的温度和功耗,找出超过安全阈值的设备,并给出简要告警说明。
一份异常 GPU 告警结果,包含超限设备及对应原因说明。
帮助团队追踪 AI 调用指标、成本与日志,并排查模型交互问题