在 vGPU 模式下,GPU 上的内存是静态分区的,但计算能力在共享 GPU 的 VM 之间分时共享。在这种模式下,当虚拟机在 GPU 上运行时,它“拥有” GPU 的所有计算能力,但只能访问其共享的 GPU 内存。
在 MIG 模式下,内存和计算能力是静态划分的。当 VM 在 MIG 模式下使用 GPU 时,它只能访问分配给它的内存,并且只能使用分配给它的计算核心。因此,即使 GPU 中剩余的计算核心(即未分配给该 VM 的核心)处于空闲状态,VM 也无法使用这些空闲核心。
无论 VM 使用哪种模式来执行其工作负载,计算结果都是相同的。唯一的区别在于使用挂钟时间测量的性能。vGPU 和 MIG 模式各有优缺点:vGPU 模式分时共享计算核心,而 MIG 模式静态划分核心。鉴于这两种模式共享内核的方式存在差异,这就提出了一个问题,即哪种模式可以为给定的工作负载提供最佳性能(即最低运行时间)。
vGPU 模式显示了使用挂钟时间测量的最佳性能,以完成具有数据传输和/或 CPU 计算与 CUDA 计算穿插的工作负载的任务。MIG 模式显示了执行繁重、大型 CUDA 内核的工作负载的最佳性能,而数据传输或 CPU 计算的中断很少或没有中断。对于具有聚合数据传输和聚合 CUDA 计算的工作负载,MIG 模式显示两个或更少虚拟机同时运行的最佳性能,而 vGPU 模式显示三个或更多虚拟机同时运行的最佳性能。