我们之前使用k8s的时候一般都是POD由Controller来分配IP地址,如果我们想固定地址,一般都是使用hostnetwork:true等配置来使用宿主机的地址,再或者直接配置service来配置svc访问的地址,这...
在k8s集群中,我们偶尔要采集业务pod日志进行日志分析,这些日志都存在于各个组件的pod的指定位置,所以我们撰写了脚本去收集,这种情况也只是用于临时的日志分析和业务状态检测,一般集群中都有各种监控日志采集系统。脚本内容...
在维护算力集群的时候有时候需要统计集群环境中使用GPU卡的POD列表,那么我们经常使用的话这里写了一个脚本方便查询和罗列出这些POD,脚本中主要使用subprocess模块来获取kubectl命令返回的结果,所以执行脚本...
之前我们有记录过一个笔记,是docker环境下通过查看到的进程PID号来查找到拥有该进程的POD,具体可以查看我之前的笔记:https://sulao.cn/post/922近期基本都在将docker环境切换到conta...
由于经常使用k8s,所以在遇到退出码含义的时候经常要去查询,所以记录到博客上方便进行查找对应的含义关系。 当一个容器达到 Exited 状态时,Docker 会在日志中报告一个退出码,告诉你容器发生...
默认的Linux发行版中的内核配置都会开启tmpfs,映射到了/dev/下的shm目录,这个就是共享内存目录,可以通过df命令查看,例如在pod中我们查看默认就是64M。/dev/shm/是linux下一个非常有用的目录...
目前我的k8s环境容器是使用的containerd,删除POD以后一直terminating,无法销毁,然后查看terminating的POD有以下事件报错 Normal Killing 8m16s ...
今天上集群查看有POD状态不正常,然后describe POD事件提示docker: Error response from daemon: open /var/lib/docker/overlay2/***: no s...