DCGM (Data Center GPU Manager) 是 NVIDIA 提供的一个用于数据中心 GPU 管理和监控的工具集,提供了以下功能1.GPU 行为监控 2.GPU 配置管理 3.GPU 策略监督 4.GP...
今天安装cuda12.04失败了,以前安装cuda基本都没有出现过失败的情况,那么我就拉看看今天安装失败打印的错误吧,错误信息如下[INFO]: Setting toolkit=true [INFO]: Adding d...
在做ubuntu集群初始化的时候第一步就是需要将具有sudo权限的账户ubuntu进行sudo命令的免密切换,设置sudo免密的方法有好几种,但是我们选择其中一种方法,就是在/etc/sudoers.d/目录下添加用户的...
发了一个算力环境基础配置的一键脚本,这里将自己写的环境验证脚本也一并发下,方便后面自己使用。#!/bin/bash #set -e function INFO(){ /bin/echo -e "\e[104m\...
自己写的算力环境基础配置一键脚本,方便自己使用,如果普通用户没有免密的话需要输入一次密码,如果是root用户就直接执行#!/bin/bash #set -e CURRENT_PATH=`readlink -f $(di...
单用户模式是一种特殊的启动模式,通常我们也可以称之为救援模式,通常用于系统维护和修复。在这个模式下,系统只启动一个超级用户(root),并且不启动网络服务和多用户环境。这对于忘记root密码、修复文件系统错误或进行其他系...
我们在ubuntu22.04安装软件时,经常遇到安装软件弹出窗口,弹出一个 Daemons using outdated libraries 弹窗,提示你Which service should be restarted...
在Ubuntu/Debian系统上,如果你通过apt安装了新内核(linux-headers-***, linux-image-***, linux-modules-***),删除这些新内核的包并更新引导配置后,重启系统...
Chrony 在动态环境(如虚拟机、移动网络)中相对于此前我们学习过的ntp时间同步表现更优,尤其适合时间偏差大或网络不稳定的场景,并且ntp默认拒绝客户端与服务器时间差 >1000 秒(约 16.7 分钟)的同步请求,...
今天要配置时间同步服务,发现自己博客还没记录ubuntu22.04上配置的笔记,所以记录下,方便自己后续使用,我们配置一台作为服务端,一台作为client端,server端使用本地时钟源。ntp这个比较老了,推荐ubun...
此前我们在centos7实践过从cgroup v1切换到cgroup v2,那么这次我们的需求是cgroup v2切换到v1,cgroup的介绍可以查看之前的笔记:https://sulao.cn/post/973我们当...
本文环境是ubuntu22.04,需求是部署单master集群,容器要求使用containerd,此前咱们在centos上部署过,也在ubuntu18.04上使用docker部署过,相关的教程可以查看此前的笔记cento...
OpenVPN 是一个功能齐全的开源传输层安全 (TLS) VPN 解决方案,可适应各种配置。 在本教程中,您将在 Ubuntu 22.04 服务器上设置 OpenVPN,然后将其配置为可从客户端计算机访问。1.安装 O...
之前用的php程序跑的应用,现在换成了python,比以前更吃内存了,所以升级了下云服务器,但是升级以后查看到内存只有1.6G,使用free命令查看内存1713188,感觉缩水很严重后面通过dmesg命令查看,发现系统预...
很多年前在centos系统上编译过一个版本,现在基本都改用ubuntu,所以在ubuntu22.04上再次进行编译并记录,此次编译的最新的17.5的版本,也包含了使用system管理postgresql服务的配置撰写。以...
ubuntu使用deb包安装指定版本内核ubuntu安装内核的方式有很多,我们之前学习过通过升级的脚本去安装指定的版本的内核,具体可以查看这里:https://sulao.cn/post/877,今天我们来看看另外两种安...
在很多集群的方案需求和设计中,都需要保持集群的服务器内核版本一致,有时由于误升级导致个别机器内核升级到新版本,所以我们需要对这些系统进行系统内核版本的切换。今天我们就来看看如何切换系统内核版本,当前前提是系统中安装了多个...
nvbandwidth是一款用于 NVIDIA 图形处理器带宽测量的工具,nvbandwidth 会使用复制引擎或内核复制方法来测量不同链路上各种 memcpy 模式的带宽。nvbandwidth 会报告您系统当前的测量...