NVIDIA HPC SDK是一套综合的编译器、库和工具,用于GPU加速HPC建模和仿真应用。随着对运行Linux的NVIDIA gpu和x86-64、OpenPOWER或Arm cpu的支持,NVIDIA HPC SD...
NVIDIA HPC-X 是一个综合软件包,包括消息传递接口 (MPI)、对称分层内存 (SHMEM) 和分区全局地址空间 (PGAS) 通信库以及各种加速包。这个功能齐全、经过测试和打包的工具包使 MPI 和 SHME...
perftest是一组基于uverbs编写的测试程序,是RDMA性能相关的benchmark。可用于软硬件调优以及功能测试。这个工具在此前的笔记中有记录并简单使用过,在 https://sulao.cn/post/979...
pdsh(Parallel Distributed Shell)是一个用于并行执行命令的工具,可以在多个远程主机上同时运行相同的命令。它对于需要在多台服务器上执行批量操作的系统管理员和开发人员非常有用。我们在使用pdsh...
nvbandwidth是一款用于 NVIDIA 图形处理器带宽测量的工具,nvbandwidth 会使用复制引擎或内核复制方法来测量不同链路上各种 memcpy 模式的带宽。nvbandwidth 会报告您系统当前的测量...
qperf 可以用来测试两个节点之间的带宽(bandwidth)和延迟(latency),不仅仅可以用来测试 TCP/IP 协议的性能指标,还可以用来测试 RDMA 传输的指标。测试前需要准备两台装有IB网卡的机器,并且...
Module是一个用于管理环境变量的工具,尤其适用于多版本软件的管理。在Ubuntu20.04上,可以通过apt安装Module。安装后需初始化并在profile中添加命令。在ubuntu中可以直接使用apt来在线安装a...
英特尔® Memory Latency Checker (英特尔® MLC) 是一种用于测量内存延迟和黑白,以及它们如何随系统负载的增加而变化的工具。它还提供了多个选项进行更细粒度的调查,其中还可以测量从一组特定内核到高...
我们之前安装过nccl,只不过都是通过yum或者apt安装,我们这次使用离线编译安装的方式再次进行nccl的安装,使用编译安装可以自定义nccl的安装目录,然后使用的时候我们需要设置下LD_LIBRARY_PATH目录即...
OSU Micro benchmark工具是由Ohio State University提供的MPI(Message Passing Interface,消息传递接口)通信效率评测工具。该工具旨在通过执行不同模式的MPI...