diff --git a/MACA.md b/MACA.md index 45bb22e..ce8fc1d 100644 --- a/MACA.md +++ b/MACA.md @@ -219,50 +219,23 @@ - **mxsmt** - **mxfw** +- **检查已安装包** + - 使用以下命令检查相关包的安装情况: + ```bash + dpkg -l | egrep "(metax|mxsmt|mxfw)" + ``` + +- **Driver 软件包内容清单** + | 文件名 | 说明 | + |------------------------------------|----------------------------------------------| + | metax-linux_x.x.x-xxx_amd64.deb | 曦云系列 GPU KMD 驱动、工具及相关配置文件 | + | mxgvm_x.x.x-xxx_amd64.deb | 曦云系列 GPU Virtualization Manager、工具及相关配置文件 | + | mxfw_x.x.x.x.all.deb | 曦云系列 GPU 固件包 | + | mxsmt_x.x.x.x.amd64.deb | mx-smi 系统管理工具,MXSML 系统管理库 | -### 虚拟化支持 - 曦云系列GPU支持基于SRIOV的硬件虚拟化,可以将物理GPU虚拟为多个vGPU使用,开启虚拟化时可以指定vGPU数量,以及对哪些GPU设备开启虚拟化,多个vGPU的资源是均等的,vGPU可以在host上使用,这种使用方式称为flat模式;vGPU也可以透传到虚拟机中使用,这种使用方式称为透传模式,目前支持的hypervisor为QEMU/KVM 在虚拟化下使用GPU可能需要用到以下两个驱动: -- MetaX GPU Virtualization Manager (mxgvm) :即运行于host主机的PF驱动,负责管理监控vGPU的运行 (在PF透传模式下不需要) -- MetaX GPU Driver (metax) :既是GPU的驱动也是vGPU的驱动,根据场景可以运行于host或虚拟机上 - - -#### 开启虚拟化BIOS配置 - - - **Intel CPU (VT-x) 配置** - ```bash - Intel VT-x Support**: 选择 `Enabled` - ``` - - - **AMD CPU (AMD-V 或 SVM) 配置** - ```bash - AMD AMD-V (或 SVM) Support**: 选择 `Enabled` - ``` - - - **MMIO空间相关配置** - ```bash - 如果有 MMIO 空间相关的选项,建议将其配置为最高值,以确保足够的内存映射输入/输出空间支持虚拟化环境 - ``` - - - **PCI 相关配置** - ```bash - SRIOV Support: 选择 `Enabled` - ARI Support: 选择 `Enabled` - ACS Support: 选择 `Enabled` - IOMMU (或 SMMU) Support: 选择 `Enabled` - ``` -#### 说明 - -- SRIOV Support: 支持单根 I/O 虚拟化,允许将物理网络适配器划分为多个虚拟功能 -- ARI Support: 支持地址重新排列,有助于提高 I/O 设备的性能 -- ACS Support: 支持层次化 I/O 设备访问控制,提高系统对 I/O 设备的并发支持 -- IOMMU(或 SMMU)Support: 支持输入/输出内存管理单元,提供更强大的虚拟化和安全功能 - -#### 注意事项 - -- 由于不同服务器厂商使用的BIOS版本不同,有些参数可能不支持或是隐藏的配置,如对BIOS的虚拟化支持有疑问,请咨询相关服务器厂商