ubuntu20.04安装horovod
Horovod是一套支持TensorFlow,Keras,PyTorch,andApacheMXNet的分布式训练框架,由Uber构建并开源的第三方库,在分布式训练中性能优于原生像Tensorflow这种ps,worker架构,且代码改动量少,无需在多个节点多次执行脚本命令,使用起来方便。首先我们需要安装nccl可以去官网查找对应版本,https://developer.nvidia.com/nccl/nccl-legacy-downloads我下的ubuntu20.04这个版本,直接安装dpkg -i nccl-l...