我们之前使用k8s的时候一般都是POD由Controller来分配IP地址,如果我们想固定地址,一般都是使用hostnetwork:true等配置来使用宿主机的地址,再或者直接配置service来配置...
helm一个命令行客户端工具,主要用于Kubernetes应用chart的创建、打包、发布和管理等。Chart代表着Helm包。它包含在Kubernetes集群内部运行应用程序,工具或服务所需的所有资...
多实例GPU(MIG)功能允许将GPU安全地划分为多个独立的GPU实例,供CUDA应用程序使用。英伟达高端GPU卡都可以开启MIG,一般MIG实例最多可分配7个。MIG主要针对于那些未充分利用GPU资...
对于k8s一中间件的数据进行一键备份,可以在做临时变更或者定期备份的场景下使用,备份mongodb主要使用了mongodump命令,etcd使用snapshot命令,prometheus是添加了--w...
在k8s集群中,我们偶尔要采集业务pod日志进行日志分析,这些日志都存在于各个组件的pod的指定位置,所以我们撰写了脚本去收集,这种情况也只是用于临时的日志分析和业务状态检测,一般集群中都有各种监控日...
在维护算力集群的时候有时候需要统计集群环境中使用GPU卡的POD列表,那么我们经常使用的话这里写了一个脚本方便查询和罗列出这些POD,脚本中主要使用subprocess模块来获取kubectl命令返回...
在k8s集群中需要生成一些普通只读账户给平台人员使用,所以这里写了个一键脚本生成只读用户,是基于clusterrole创建的集群级别的用户,权限可以自己根据自己的需求进行修改,脚本内容如下:#!/bi...
有些场景下我们需要在多个POD中使用同一个volume,这种情况在就不能直接直接写在同一个目录下,而需要使用该目录下针对每个POD的子目录,这个时候就可以使用subPath。同时如果configMap...
由于经常使用k8s,所以在遇到退出码含义的时候经常要去查询,所以记录到博客上方便进行查找对应的含义关系。 当一个容器达到 Exited 状态时,Docker 会在日志中报告一个退...
k8s已经支持GPU设备的调度和POD容器挂载,需要做以下配置1.首先我们需要再宿主机安装驱动2.需要安装nvidia-container-runtime3.GPU节点打标签并部署k8s-device...
我们重新部署了k8s环境,centos7环境下使用的k8s1.27.0这个版本,今天在部署k8s上使用storageclass资源资源部署nfs使用时,POD挂载nfs资源报错提示“unexpecte...
之前我们部署k8s多master高可用集群中使用的代理均衡器是nginx,这次我们使用haproxy来做负载均衡器,之前的笔记也会用到,可以查看之前的笔记:https://sulao.cn/post/...
集群部署k8s1.23.0版本,容器使用的是containerd1.7.10版本规划的集群信息如下192.168.1.72 master1 192.168.1.73 master2 192.1...
之前有记录使用containerd部署k8s集群的笔记,这次记录一个已有k8s集群从docker切换到containerd方法的笔记,下面就介绍切换的操作过程首先下载containerd包wget h...
由于k8s高版本后面不支持docker,所以需要使用containerd替代docker,下面是部署过程,整个部署基本和原来记录的差距不大,但是还是有些注意事项首先关闭防火墙systemctl sto...
之前我们做过k8s证书续期的笔记,但是1.19以上版本就有些不一样了,所以重新记录一篇,感兴趣的可以查看我之前的笔记:https://sulao.cn/post/843k8s大体上续订证书基本还是一致...
之前我们学习了创建基于集群级别的账号和管理配置的方法,具体可以查看这个笔记:https://sulao.cn/post/936实际在k8s的使用过程中,我们通常以命名空间来隔离项目或者团队,那么这个时...
我们有时需要添加一些自定义域名在k8s集群环境中使用,那么这时候域名解析需要依赖K8s内部的dns域名服务器来解析。例如我们提供了一个nfs服务器,但是提供的nfs服务器不是IP,而是域名,这个时候这...