在 vGPU 模式下,GPU 上的内存是静态分区的,但计算能力在共享 GPU 的 VM 之间分时共享。在这种模式下,当虚拟机在 GPU 上运行时,它“拥有” GPU 的所有计算能力,但只能访问其共享的 GPU 内存。
在 MIG 模式下,内存和计算能力是静态划分的。当 VM 在 MIG 模式下使用 GPU 时,它只能访问分配给它的内存,并且只能使用分配给它的计算核心。因此,即使 GPU 中剩余的计算核心(即未分配给该 VM 的核心)处于空闲状态,VM 也无法使用这些空闲核心。

无论 VM 使用哪种模式来执行其工作负载,计算结果都是相同的。唯一的区别在于使用挂钟时间测量的性能。vGPU 和 MIG 模式各有优缺点:vGPU 模式分时共享计算核心,而 MIG 模式静态划分核心。鉴于这两种模式共享内核的方式存在差异,这就提出了一个问题,即哪种模式可以为给定的工作负载提供最佳性能(即最低运行时间)。
vGPU 模式显示了使用挂钟时间测量的最佳性能,以完成具有数据传输和/或 CPU 计算与 CUDA 计算穿插的工作负载的任务。MIG 模式显示了执行繁重、大型 CUDA 内核的工作负载的最佳性能,而数据传输或 CPU 计算的中断很少或没有中断。对于具有聚合数据传输和聚合 CUDA 计算的工作负载,MIG 模式显示两个或更少虚拟机同时运行的最佳性能,而 vGPU 模式显示三个或更多虚拟机同时运行的最佳性能。
内容版权声明:除非注明,否则皆为本站原创文章。
转载注明出处:https://sulao.cn/post/981
相关阅读
- GPU服务器dmesg日志报错"Cannot map memory with base addr ..."的解决方案
- AI程序索引越界引起的nvidia-fabricnamage异常问题排查
- 英伟达GPU内核和驱动优化参数介绍
- 英伟达GPU nvidia-smi常用命令详解
- GPU卡住且dmesg日志中打印NVRM: _threadNodecheckTimeout错误排查
- linux下gpu降速问题排查
- ubuntu22.04安装dcgm和基本用法
- RTX 5090在cuda13.0下gpu-burn编译报错的解决方法
- k8s集群部署gpu-operator支持gpu节点自动发现和gpu上报
- ubuntu22.04算力环境基础配置一键验证脚本
评论列表