Horovod 是一套支持TensorFlow, Keras, PyTorch, and Apache MXNet 的分布式训练框架,由 Uber 构建并开源的第三方库,在分布式训练中性能优于原生像Tensorflow这...
iostat是I/O statistics(输入/输出统计)的缩写,iostat工具将对系统的磁盘操作活动进行监视。它的特点是汇报磁盘活动统计情况,同时也会汇报出 CPU使用情况iostat的语法如下iostat [ 选...
linux中/dev目录下一般都是一些设备文件,例如磁盘、内存、摄像头等,其中/dev/shm这个目录是linux下一个利用内存虚拟出来的一个目录,这个目录中的文件都是保存在内存中,而不是磁盘上。其大小是非固定的,即不是...
查看k8s上有一些POD日志中提示Error: failed to create FS watcher: no space left on device看到这个错误提示第一时间想到的是是不是磁盘用满了,然后我开始检查机器...
下载linux系统基本都是用systemd启动系统并管理进程journalctl可以查看所有的系统日志文件,由于日志信息量很大,journalctl还提供了各种参数帮助用户更快速的定位到日志信息默认情况下,用户都可以访问...
最近经常遇到pip安装包非常慢的情况,之前加-i参数来临时更换下载源,pip之前的笔记可以查看这里https://sulao.cn/post/581,但是这次情况是下载torch,更换了pip源以后提示什么证书验证的警告...
首先我们登录mongodb./mongo然后选择adimn库use admin; db.createUser({ user: 'admin', pwd: 'admin123', roles:[{ ro...
今天有遇到libGL.so无法找到这个共享库的问题,具体报错如下from .cv2 import * ImportError: libGL.so.1: cannot open shared object file: No...
k8s之前配置存储卷容量太小,之前设置的容量规格已经不能满足现有资源存储,那么我们需要进行扩容kubernetes 1.11版本中开始支持pvc创建后的扩容,这点很方便,但是还是有前提,是我们必须配置存储资源对象Stor...
nsenter命令是一个可以在指定进程的命令空间下运行指定程序的命令,它位于util-linux包中,可以直接使用yum进行安装yum install -y util-linux用nsenter --help可以查看命令...