此前我们做了一个单机多卡的nccl-tests部署测试脚本,多集卡多卡的我们也需要经常测试,所以这次记录了一个自己用的多机多卡openmpi+nccl+nccl-tests编译安装脚本,注意不含测试,这个脚本最终编译完成...
perftest是一组基于uverbs编写的测试程序,是RDMA性能相关的benchmark。可用于软硬件调优以及功能测试。这个工具在此前的笔记中有记录并简单使用过,在 https://sulao.cn/post/979...
NCCL Tests是一个开源的测试套件,由NVIDIA开发并维护,目的是为了帮助开发者更好地理解和利用NCCL的功能。它提供了多种并发和消息传递模式的基准测试,以评估多GPU间的通信效率,并且支持各种CUDA和MPI环...
test命令是linux上常用命令,对于我个人来说一般都是test下目录是否存在或者是上条命令执行返回状态,返回1则是假,返回0则是真,跟其它的编程语言正好返回状态码是反的,其实用if判断也成,看个人喜好,我这个命令也用...