ubuntu22.04安装nvidia-fabricmanager

nvlink的GPU卡都需要安装fabricmanager,此前在centos的机器部署过fabricmanager,现在需要在ubuntu2204上进行部署,之前的笔记可以直接查看这里:https://sulao.cn/post/913

接着我们来看下安装的方法,实际安装比较简单,但是需要注意的是,fabricmanager安装的版本要GPU卡驱动要严格一致。

我们使用如下命令看是否是nvlink的卡

nvidia-smi nvlink --status

202507281541346761263898.png

如果没有打印任何东西说明不是nvlink的话,如果打印了上述信息的话,我们就需要进行fabricmanager的安装。

首先下载安装包,注意下载的包的版本号需要大小版本号严格匹配,下面下载链接可以直接修改下载即可,下载后记可以使用dpkg命令进行安装

wget https://developer.download.nvidia.cn/compute/cuda/repos/ubuntu2204/x86_64/nvidia-fabricmanager-570_570.172.08-1_amd64.deb
dpkg -i nvidia-fabricmanager-570_570.172.08-1_amd64.deb

安装完成以后启动并设置开机启动

systemctl start nvidia-fabricmanager.service
systemctl enable nvidia-fabricmanager.service
systemctl status nvidia-fabricmanager.service

202507281100304084040673.png

然后我们还需要加载nvidia_peermem,使用如下命令进行加载

modprobe nvidia_peermem

一般建议写入开机启动来开机自动加载,可以自行查找开机启动的方案,也可以查看我之前的笔记:https://sulao.cn/post/882

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://sulao.cn/post/1106

评论列表

0%