今天有同事反馈有请求报错502,我于是检查系统上的日志发现有如下错误信息[Thu Jun 18 23:15:31 2026] NVRM: _threadNodeCheckTimeout: _threadNodeCheck...
今天遇到一个节点卡住的问题,登录就一直卡着,直到好半天登录上去,查看dmesg日志,发现打印了以下错误信息从上述日志分析到时状态切换超时的问题,然后检查GPU状态,发现GPU未开启持久模式这种情况下可能是由于GPU在无任...
今天有同事反馈有请求报错502,我于是检查系统上的日志发现有如下错误信息[Thu Jun 18 23:15:31 2026] NVRM: _threadNodeCheckTimeout: _threadNodeCheck...
今天遇到一个节点卡住的问题,登录就一直卡着,直到好半天登录上去,查看dmesg日志,发现打印了以下错误信息从上述日志分析到时状态切换超时的问题,然后检查GPU状态,发现GPU未开启持久模式这种情况下可能是由于GPU在无任...