NVIDIA HPC SDK是一套综合的编译器、库和工具,用于GPU加速HPC建模和仿真应用。随着对运行Linux的NVIDIA gpu和x86-64、OpenPOWER或Arm cpu的支持,NVIDIA HPC SD...
NVIDIA HPC-X 是一个综合软件包,包括消息传递接口 (MPI)、对称分层内存 (SHMEM) 和分区全局地址空间 (PGAS) 通信库以及各种加速包。这个功能齐全、经过测试和打包的工具包使 MPI 和 SHME...
perftest是一组基于uverbs编写的测试程序,是RDMA性能相关的benchmark。可用于软硬件调优以及功能测试。这个工具在此前的笔记中有记录并简单使用过,在 https://sulao.cn/post/979...
pdsh(Parallel Distributed Shell)是一个用于并行执行命令的工具,可以在多个远程主机上同时运行相同的命令。它对于需要在多台服务器上执行批量操作的系统管理员和开发人员非常有用。我们在使用pdsh...
nvbandwidth是一款用于 NVIDIA 图形处理器带宽测量的工具,nvbandwidth 会使用复制引擎或内核复制方法来测量不同链路上各种 memcpy 模式的带宽。nvbandwidth 会报告您系统当前的测量...
qperf 可以用来测试两个节点之间的带宽(bandwidth)和延迟(latency),不仅仅可以用来测试 TCP/IP 协议的性能指标,还可以用来测试 RDMA 传输的指标。测试前需要准备两台装有IB网卡的机器,并且...
Module是一个用于管理环境变量的工具,尤其适用于多版本软件的管理。在Ubuntu20.04上,可以通过apt安装Module。安装后需初始化并在profile中添加命令。在ubuntu中可以直接使用apt来在线安装a...
英特尔® Memory Latency Checker (英特尔® MLC) 是一种用于测量内存延迟和黑白,以及它们如何随系统负载的增加而变化的工具。它还提供了多个选项进行更细粒度的调查,其中还可以测量从一组特定内核到高...
OSU Micro benchmark工具是由Ohio State University提供的MPI(Message Passing Interface,消息传递接口)通信效率评测工具。该工具旨在通过执行不同模式的MPI...
NVIDIA Nsight™ Systems 是一款系统级性能分析工具,旨在实现应用算法的可视化,找出程序中最值得优化的"瓶颈",并进行调整以跨任意数量或大小的 CPU 和 GPU (从大型服务器到最小的系统级芯片 (S...
Stream内存性能测试工具是一套综合性能测试程序集,它主要通过Fortran和C两种高级且高效的语言编写而成,这两种语言在数学计算方面的高效率,使得Stream测试能够充分发挥出内存的能力。Stream测试主要通过四种...
gpu-burn是一款GPU压力测试工具,今天就来介绍下如何安装和使用gpu-burn。首先我们我先去拉取源码包,地址是:https://github.com/wilicc/gpu-burn,目前也支持部分操作系统的二进...
MemTester是一个用于压力测试内存子系统的工具,它特别有效于发现间歇性和非确定性的故障。以下是MemTester的一些主要特点和功能。内存错误捕获:MemTester主要用于捕获内存错误和识别一直处于高或低电平的坏...
FIO是一个开源的、强大的I/O性能测试工具,可以用来对存储设备进行随机读写、顺序读写等负载测试。目前我们现整理记录下,后面使用的时候再进行补充和完善。我们还是首先需要进行安装sudo apt install libai...
sysbench对CPU测试的原理是通过创建多个线程,并让它们执行计算密集型任务来测试 CPU 性能。它会记录每个线程执行任务所需的时间,并计算出整个测试过程的平均值、最小值和最大值,甚至输出直方图展示延迟时间,方便评估...
helm一个命令行客户端工具,主要用于Kubernetes应用chart的创建、打包、发布和管理等。Chart代表着Helm包。它包含在Kubernetes集群内部运行应用程序,工具或服务所需的所有资源定义。你可以把它看...
Supervisor 是用 Python 开发的一套通用的进程管理程序,能监控进程的状态,在进程异常退出时能自动重启,supervisor依赖python,因为我们是python项目,所以环境里面已经包含了python,...
NCCL Tests是一个开源的测试套件,由NVIDIA开发并维护,目的是为了帮助开发者更好地理解和利用NCCL的功能。它提供了多种并发和消息传递模式的基准测试,以评估多GPU间的通信效率,并且支持各种CUDA和MPI环...
Supervisor是用Python开发的一个client/server服务,是Linux/Unix系统下的一个进程管理工具,不支持Windows系统。它可以很方便的监听、启动、停止、重启一个或多个进程。因为superv...