Flannel在每台主机上运行一个名为flanneld的小型二进制代理,负责从一个更大的、预先配置的地址空间中为每台主机分配子网租赁。Flannel使用Kubernetes API或etcd直接存储网络配置、分配的子网和...
Xid 消息是来自 NVIDIA 驱动程序的错误报告,会打印到操作系统的内核日志或事件日志中。Xid 消息表明发生了普遍的 GPU 错误,通常是因为驱动程序错误地对 GPU 进行了编程,或者是因为发送给 GPU 的指令出...
在Linux系统上使用GPU时,可能会因为GPU的GSP(GPU System Processor)组件运行状态异常,导致GPU卡在初始化时提示失败(例如出现XID 119或XID 120错误信息),本文为您介绍这种情况...
Chrony 在动态环境(如虚拟机、移动网络)中相对于此前我们学习过的ntp时间同步表现更优,尤其适合时间偏差大或网络不稳定的场景,并且ntp默认拒绝客户端与服务器时间差 >1000 秒(约 16.7 分钟)的同步请求,...
今天要配置时间同步服务,发现自己博客还没记录ubuntu22.04上配置的笔记,所以记录下,方便自己后续使用,我们配置一台作为服务端,一台作为client端,server端使用本地时钟源。ntp这个比较老了,推荐ubun...
此前我们在centos7实践过从cgroup v1切换到cgroup v2,那么这次我们的需求是cgroup v2切换到v1,cgroup的介绍可以查看之前的笔记:https://sulao.cn/post/973我们来...
由于我的harbor仓库和k8s所在的服务器经常要关机,今天开机以后k8s启动,k8s上的harbor仓库的harbor-harbor-database-0 POD直接error了,查看日志打印了以下信息:Default...
Cmder是一款为 Windows 用户量身打造的增强型终端模拟器,旨在解决传统 Windows 命令行工具(如 CMD 和 PowerShell)界面简陋、功能受限、用户体验不足等问题。它基于强大的 ConEmu 框架...
使用mdadm工具创建软raid阵列,我们之前学习实践过,可以查看之前的笔记:https://sulao.cn/post/1085,今天我们记录学习下如果软raid阵列中有损坏的盘,我们如何进行替换故障盘。1.创建软ra...
此前我们发布了一个基于gpu-burn基准测试的参考笔记,这里也记录下nccl-tests测试的记录,方便后续测试进行参考,测试的环境是单机多卡,因为多机测试的话就会依赖RDMA网络,所以记录单机,分为nvlink和pc...