shevechco的写作文章列表 - 第3页

荐 k8s集群部署gpu-operator支持gpu节点自动发现和gpu上报

我们此前都是手工部署nvidia-container-runtime，上报gpu信息使用的k8s-device-plugin，这些都是手工部署的，其中nvidia-container-runtime的部署涉及修改cont...

LVM删除和磁盘重新格式化的方法

如果一块磁盘做了LVM逻辑卷管理，那么我们重置这块磁盘再使用时不能直接mkfs，这样无法彻底删除LVM的底层元数据，我们需要按照以下操作顺便来删除LVM，并擦除格式化使其成为一块正常硬盘使用。1.查看lv/vg/pv我们...

ubuntu22.04算力环境基础配置一键验证脚本

发了一个算力环境基础配置的一键脚本，这里将自己写的环境验证脚本也一并发下，方便后面自己使用。#!/bin/bash #set -e function INFO(){ /bin/echo -e "\e[104m\...

ubuntu
gpu

ubuntu22.04算力环境基础配置一键脚本

自己写的算力环境基础配置一键脚本，方便自己使用，如果普通用户没有免密的话需要输入一次密码，如果是root用户就直接执行#!/bin/bash #set -e CURRENT_PATH=`readlink -f $(di...

ubuntu
gpu

linux下bash操作字符串常见方法整理

bash字符串操作实际经常写也经常查，但是基本就是记不住，所以就自己专门开一篇笔记来记录下，方便在自己的博客上来查，例子就以英伟达驱动的名字为例。NVIDIA_DRIVER="NVIDIA-Linux-x86_64-58...

linux
bash

nccl-tests多机多卡测试环境一键编译部署脚本

此前我们做了一个单机多卡的nccl-tests部署测试脚本，多集卡多卡的我们也需要经常测试，所以这次记录了一个自己用的多机多卡openmpi+nccl+nccl-tests编译安装脚本，注意不含测试，这个脚本最终编译完成...

ubuntu22.04忘记root密码进入单用户模式修改密码

单用户模式是一种特殊的启动模式，通常我们也可以称之为救援模式，通常用于系统维护和修复。在这个模式下，系统只启动一个超级用户（root），并且不启动网络服务和多用户环境。这对于忘记root密码、修复文件系统错误或进行其他系...

linux使用sshpass实现免交互输入密码

sshpass 是一个允许用户在非交互式 SSH 会话中自动输入密码的工具，这使得它在自动化脚本和批量处理任务中非常有用，SSH使用直接TTY访问来确保密码确实是由交互式键盘用户发出的。sshpass在专用的TTY中运行...

linux使用mtr命令来追踪路由网络状态

MTR（My Traceroute）是一个结合了 traceroute 和 ping 功能的开源网络诊断工具。它通过发送 ICMP 或 UDP 数据包，实时显示数据包经过的路由器及其响应时间，帮助用户分析网络延迟、丢包等...

linux
mtr

windows10/11设备管理器中其他设备中存在未知设备的解决方法

我们在完成windows10或者windows11安装以后，在设备管理器中的其他设备中，查看到一个未知设备，这个时候我们使用过其他第三方驱动软件进行驱动的安装，发现这个未知设备还是存在，这个时候说明这个设备要么太新，要么...

k8s节点多网卡下指定某一个ip为节点INTERNAL-IP

INTERNAL-IP由kubelet进程选择或指定，也就是我们kubectl get node -o wide 查看到的INTERNAL-IP，这个地址如果在多张网卡或者多个IP的场景下可能会产生不是我们所预期的IP，...

linux中update-initramfs的用途和功能

update-initramfs 是在 Linux 系统中用于更新 initramfs 归档文件的一个命令。initramfs（初始内存文件系统）是一个临时的根文件系统，它在系统启动过程中加载到内存中。它包含了启动时直到...

mysql查询表大小和库大小的方法

在如何查询之前我们先了解下information_schema，在MySQL中，把 information_schema 看作是一个数据库，确切说是信息数据库。其中保存着关于MySQL服务器所维护的所有其他数据库的信息。...

ubuntu22.04屏蔽使用apt安装软件时出现弹窗要求选择重启服务的方法

我们在ubuntu22.04安装软件时，经常遇到安装软件弹出窗口，弹出一个 Daemons using outdated libraries 弹窗，提示你Which service should be restarted...

flask实现站点地图(sitemap.xml)功能

站点地图是为了更好的方便搜索引擎的爬虫来抓取网站文章，这样能够更好的提升收录，后面可以提升权重和被用户查找到文章的概率，所以今天我们就来使用flask实现站点地图的功能。实际上，实现这个功能主要使用flask的Respo...

使用celery推入flask上下文时打印多次同样日志的处理方法

由于我们很多统计和备份的任务，所以单独使用celery来做这些耗时或者需要定时处理的工作，但是在使用的过程中出现一些问题，就是发现日志中打印的celery相关的日志时会多次打印同样的信息，次数和我的flask和celer...

nccl-tests英伟达GPU单机多卡一键测试脚本

由于经常需要做测试，所以撰写了一个测试单机多卡的bash脚本，前提需要环境中已经安装nvidia驱动和cuda库，且cuda库安装在默认目录/usr/local/下，然后nccl我是下载的zip包，名字是nccl-mas...

ubuntu22.04删除系统中的新内核并回退的方法

在Ubuntu/Debian系统上，如果你通过apt安装了新内核（linux-headers-***, linux-image-***, linux-modules-***），删除这些新内核的包并更新引导配置后，重启系统...

flask开发中几种接口参数验证的技巧

我们在flask开发中会经常遇到接口上需要做参数验证的情况，有时候有很多接口都有很多同样的必填参数需要进行验证，那么我们可以使用一些技巧对这些参数进行统一验证，这样让接口中的代码更加简洁，我们来看下如何撰写这类代码1.使...

荐 k8s使用SA和Secret配置私有仓库镜像拉取凭证

我们目前使用的containerd，之前有在config.toml文件中配置私有仓库镜像拉取所需要的账户和密码，实际我们也可以在k8s中配置拉取镜像的认证问题，这样可以不用动config.toml的配置也能拉取到镜像。实...

今日天气

分类统计

博文归档

7篇

5篇

3篇

1篇

2篇

8篇

6篇

7篇

3篇

12篇

15篇

43篇

热门推荐

热门标签