我们在安装linux图像化界面时,开机启动以后Xorg运行起来后自动占用英伟达显卡,在某些使用GPU的情况下会让程序运行失败所以我们需要关闭Xorg对GPU的占用,具体操作如下我们首选需要关闭图形化界面,使用如下命令in...
CRI(Container Runtime Interface,容器运行时接口)是kubernetes定义的接口,定义了如何操作容器和镜像的统一规范,它主要包含ImageService和ContainerService。...
kubelet 是运行在每个节点上的主要的"节点代理",每个节点都会启动 kubelet进程,用来处理 Master 节点下发到本节点的任务,按照 PodSpec 描述来管理Pod 和其中的容器(PodSpec 是用来...
k8s中可以对namespace来做资源限制,主要通过 ResourceQuota 对象来定义资源配额限制,它可以限制命名空间中某种类型的对象的总数目上限,也可以限制命令空间中的 Pod 可以使用的计算资源的总上限。首先...
在 Linux 系统中,一个进程结束了,但是他的父进程没有等待(调用wait / waitpid)他,那么他将变成一个僵尸进程。当用ps命令观察进程的执行状态时,看到这些进程的状态栏为defunct。僵尸进程是一个早已死...
MongoDB的日志可以完成的记录mongodb的健康状态和运行情况,有助于我们在出现故障的时候对MongoDB的故障进行有效的分析。在MongoDB4.4以前和以后的版本日志记录的格式是不一样的,4.4以前的格式是<t...
vmstat命令是监控linux内存的常用工具,可以对操作系统的虚拟内存、进程、CPU等的整体情况进行监视,通常对Linux系统来说,虚拟内存就是swap分区。用法参数Usage: vmstat [options] [...
k8s部署es的时候需要初始化很多linux的内核参数。 但是文件系统挂载到pod容器中就会变成read-only,难以进行操作实现需求。所以需要给POD privileged权限,然后在容器的初始化脚本或代码中去修改s...
Ubuntu 16.04 以后的版本不再支持 update-rc.d 方式添加开机自启脚本,只能使用 systemctl 命令进行添加。之前开机启动的方式可以查看我之前的笔记:https://sulao.cn/post/...
GPU开启了持久模式以后,即使没有活动的客户端,NVIDIA驱动程序也会保持加载状态,这样可以很大程度减少与运行依赖程序的加载时间,适用于所有的CUDA产品。Persistence-M (Persistence Mode...
ubuntu安装jupyter操作比较简单,ubuntu20.04上自带python3.8,我们直接使用pip进行安装jupyter即可pip install jupyter -i https://pypi.tuna.t...
工作中经常用到,记录下,首先我们需要备份下原来的源文件,将默认的 APT 源更换为国内镜像源可以显著提高软件包下载和更新的速度。sudo cp /etc/apt/source.list /etc/apt/source....
Linux内核的主要作用:硬件管理: 内核负责与计算机硬件进行交互,管理各种硬件设备(如处理器、内存、硬盘、网络适配器等)。它确保这些硬件能够协同工作,以完成各种任务。系统调度: 内核负责管理运行在计算机上的各个进程(程...
之前咱们学习了keepalive的各种模式,详情可以查看这个笔记https://sulao.cn/post/874,这次我们就在上次学习的基础上部署keepalive非抢占单播模式在配置部署之前我们我们先了解下单播,组播...
搜索了相关资料,导致该错误可能是没有avx指令集,或者是CPU不支持avx指令集因为我本地是虚拟机上部署的k8s集群,有可能CPU虚拟化没有做指令集的直通,那么我尝试修改KVM虚拟机配置首先我们关闭虚拟机,然后使用vir...
之前我们学习过keepalive的部署,这次我们来学习下keepalive各种运行模式keepalive目前有两种运行模式1.抢占模式抢占模式下其实还可以分组主主模式和主备模式主备模式:当master宕机或者网络等各种因...
有时我们在服务器异常重启以后,部署在上面的k8s执行kubectl命令直接提示The connection to the server 192.168.1.72:6443 was refused - did you sp...
在k8s的项目中今天需要停止某一节点的服务,对该节点进行更新、升级、或者是更换硬件时,这个时候需要对节点进行设置,让其不参与k8s的调度,具体的设置方法如下使用cordon设置节点不可调度kubectl cordon n...
Horovod 是一套支持TensorFlow, Keras, PyTorch, and Apache MXNet 的分布式训练框架,由 Uber 构建并开源的第三方库,在分布式训练中性能优于原生像Tensorflow这...