centos7内核影响GPU驱动无法安装

我们对centos7内核进行了升级,具体笔记可以查看笔记:https://sulao.cn/post/949.html,然后GPU驱动需要重新安装,安装的时候有以下报错An error occurred while performing the step: "Building kernel modules"我们安装驱动常见问题主要就是内核头文件,所以首先对这个进行了检查,由于之前升级内核,头文件还是3.10的,所以我们需要进行卸载,然后安装对应的...

阅读全文

containerd配置nvidia-container-runtime

之前我们在centos/ubuntu上安装过nvidia-container-runtime,配置也都是在docker中配置的,那么我们最近本地环境整体从docker换成了containerd,那么今天就来记录下在containerd中如何配置默认的runc到nvidia的containerruntime。安装的话还是可以查看以前的笔记centos7安装:https://sulao.cn/post/942.htmlubuntu安装:https://sulao.cn/post/919.html接下来修改/etc/containerd/config.tom...

阅读全文

centos7安装nvidia-container-runtime

之前ubuntu安装的可以查看之前笔记:https://sulao.cn/post/919.htmlcentos上安装也很简单,首先设置存储库和GPG密钥distribution=$(. /etc/os-release;echo $ID$VERSION_ID)curl -s -L https://nvidia.github.io/nvidia-container-runtime/$distribution/nvidia-container-runtime.repo | \&...

阅读全文

centos7安装英伟达GPU驱动

首先安装一些必要的依赖包yum install -y pciutils gcc gcc-c++ gcc-gfortran使用lspci命令检查是否有nvidia硬件lspci | grep -i nvidia关闭nouveau,把nouveaukerneldriver加入黑名单vi /lib/modprobe.d/dist-blacklist.conf将nvidiafb行注释掉,并在最后加入以下两行#blacklist nvidia...

阅读全文

CUDA库的安装和samples的使用方法

我们的环境是centos7,可以去官网下载指定版本的cuda库:https://developer.nvidia.com/cuda-toolkit-archive,我们这里以12.0的cuda库为例。wget https://developer.download.nvidia.com/compute/cuda/11.0.1/local_installers/cuda_11.0.1_450.36.06_linux.runsudo sh cuda_11.0.1_450.36.06_linux.run安装的时候我们就不再勾选D...

阅读全文

ubuntu20.04安装和卸载英伟达GPU驱动

在ubuntu上安装显卡驱动有几种方式,可以使用图形界面的方式安装,也可以使用命令行来安装,我们这里主要来讲使用命令行的方式安装,安装的方式也有两种,分为在线安装和离线安装。安装的时候推荐关掉图形化界面,进入终端模式进行安装sudo telinit 3 # 使用sudo telinit 5命令可以重新进入图形化界面1.使用命令行在线安装的方式如下更新所有的软件包和加入官方的ppa源sudo add-apt-repository ppa:graphics-drivers/ppa...

阅读全文

ubuntu安装nvidia-container-runtime

借助NVIDIAContainerRuntime,开发人员只需在创建容器期间注册一个新的运行时,即可将NVIDIAGPU暴露给容器中的应用程序。目前官网上NVIDIAContainerRuntime介绍如下NVIDIAContainerRuntimeisaGPUawarecontainerruntime,compatiblewiththeOpenContainersInitiative(OCI)specificationusedbyDocker,CRI-O,andotherpopula...

阅读全文

linux下NVLink版NVIDIA A100安装Fabric-manager的方法

NVIDIANVLinkA100GPU卡,需额外安装与驱动版本对应的nvidia-fabricmanager服务使GPU卡间能够互联通过NVSwitch互联,如果仅安装NVIDIAGPU驱动程序,会导致GPU不能正常使用。下面列出了ubuntu和centos7的安装方法,均是通过在线源来安装1.ubuntu的安装方式如下:首先需要安装数据中心GPU管理器,安装nvidiaDCGM,本次安装是在ubuntu上进行安装,获得存储库密钥:wget https://developer.download.nvidia.com/comp...

阅读全文

xorg进程占用GPU的解决方法

我们在安装linux图像化界面时,开机启动以后Xorg运行起来后自动占用英伟达显卡,在某些使用GPU的情况下会让程序运行失败所以我们需要关闭Xorg对GPU的占用,具体操作如下我们首选需要关闭图形化界面,使用如下命令init 3然后生成Xorg置文件Xorg -configure然后修改/usr/share/X11/xorg.conf.d/nvidia-drm-outputclass.conf文件该文件会让Xserver自动加载nvidia驱动,所以我们我们需要删除或者改名该文件即可cd /usr/share/X11/xo...

阅读全文

开启GPU持久模式的方法

GPU开启了持久模式以后,即使没有活动的客户端,NVIDIA驱动程序也会保持加载状态,这样可以很大程度减少与运行依赖程序的加载时间,适用于所有的CUDA产品。Persistence-M(PersistenceMode)persistencemode持续模式默认关闭。persistencemode能够让GPU更快响应任务,待机功耗增加。关闭persistencemode同样能够启动任务。具体命令如下nvidia-smi -pm 1Persistence-M从Off变成On,持续模式打开...

阅读全文