之前我们学习了创建基于集群级别的账号和管理配置的方法,具体可以查看这个笔记:https://sulao.cn/post/936实际在k8s的使用过程中,我们通常以命名空间来隔离项目或者团队,那么这个时候就有一些需求,就是...
当程序出错或者异常退出的时候,满足一定条件会产生coredump,并产生core文件,当然有时也不会生成,会提示coredump,这时我们需要对环境进行配置才会产生core文件。首先我们需要通过ulimit敏玲查看cor...
我们的环境是centos7,可以去官网下载指定版本的cuda库:https://developer.nvidia.com/cuda-toolkit-archive,我们这里以12.0的cuda库为例。wget https...
Tensorflow运行报错'Could not load dynamic library libcudnn.so.8',该报错是由于没有cudnn导致,可以在https://docs.nvidia.com/deeple...
AI Benchmark Alpha是一个开源的python库,用于评估各种硬件平台的AI性能,包括cpu, gpu和tpu。该基准依赖于TensorFlow机器学习库,并为评估关键深度学习模型的推理和训练速度提供了一个...
我们使用docker时也会遇到镜像commit超过最大层数的问题,所以解决这个问题的前提是我们需要了解怎么样查看镜像构造和层级目前docker 构建镜像最大是127层,在docker build时基本每行命令都是一层,再...
在ubuntu上安装显卡驱动有几种方式,可以使用图形界面的方式安装,也可以使用命令行来安装,我们这里主要来讲使用命令行的方式安装,安装的方式也有两种,分为在线安装和离线安装。安装的时候推荐关掉图形化界面,进入终端模式进行...
之前我们记录过使用pymongo模块操作mongodb数据库,但是操作mongodb集群的话连接配置有一些差异。连接mongodb集群需要使用下面的配置方式连接client = MongoClient('mongodb:...
原来集群中一个master节点操作系统坏掉了,所以需要重装操作系统,然后以master身份加入到原有集群。安装好docker和k8s以后,使用kubeadm Join命令加入集群一直报错,错误信息如下:The reset...
之前有记录如何获取token的方法:https://sulao.cn/post/800,添加普通节点时,可以直接通过以下命令获取添加节点全部命令kubeadm token create --print-join-comm...
今天上集群查看有POD状态不正常,然后describe POD事件提示docker: Error response from daemon: open /var/lib/docker/overlay2/***: no s...
nerdctl是一个类似于Docker CLI的命令工具,用于管理和运行容器,它提供与Docker兼容的接口,并支持和containerd集成。nerdctl安装首先下载安装包wget https://github.co...
通过进程PID查询POD的几种方法1.通过mountinfo获取容器IDcat /proc/14890/mountinfo | grep "etc-hosts" 1332 1310 253:2 /var/lib/kube...
在用户使用kubectl命令提交yaml时,其实在整个k8s中很多组件都协调运作最终直观的展示生成的POD,那么这中间经历了很多流程,我们来看看这其中流程和原理具体是什么样的。当用户kubectl提交yaml文件以后,k...
在K8S 1.9版本开始支持Deployment控制器,是基于第二代控制器replicaSet控制器的升级版,拥有更高级的镜像回滚等等高级功能。下面我们来看看使用DeployMent回滚到某一版本的具体操作查看orion...
prometheus的web页面访问默认是没有账户密码认证的,这样如果部署暴露在公网上非常的不安全,可以使用httpd-tools工具对其进行basic_auth加密,这样登录的时候就需要输入账号密码了。首先我们安装工具...