Update test

mirror 2024-10-12 15:03:40 +08:00
parent 6893e54052
commit bdc7671b03

15
test.md

@ -1,10 +1,5 @@
| 序号 | 检查项目 | 检查命令 | 说明 | ## 系统兼容性要求
|------|---------------------|-------------------------------|---------------------------------------------------------------------------------------------------------------|
| 1 | 服务器CPU架构、操作系统、内核版本 | uname -m, lsb_release -a, uname -r | 确认CPU架构、操作系统和内核版本是否在软硬件平台兼容列表中, 不匹配则需更新环境 | - 若曦云系列GPU无法识别为PCIe设备(可通过 `lspci | grep 9999` 进行查看)需关闭BIOS里兼容性支持模块 (CSM)选项。
| 2 | 系统是否安装过驱动 | lsmod | grep metax | - 若无内容显示, 表示未安装软件包, 可直接安装<br/>- 若有内容显示, 表示已安装, 需要卸载后再安装 | - 若PCIe BAR需要支持4GB以上地址空间需打开BIOS里Large Bar选项。
| 3 | 板卡是否在位 | lspci | grep 9999 | 确认GPU板卡正常在位, 含“9999”的行数应与板卡数量匹配 | - 每张曦云系列GPU板卡需要三个BAR空间大小分别为1 MB、8 MB和64 GB。
| 4 | udev 配置 | cat /etc/udev/rules.d/70-metax.rules | - 若有群组管理需要: <br/> 只允许 video 组的成员使用曦云 GPU, 则配置文件有如下内容: <br/> KERNEL=="mxcd", GROUP="video", MODE="0660" <br/> KERNEL=="renderD[0-9]*", GROUP="video", MODE="0660" <br/> - 若没有以上内容, 则表示只有 root 用户可以使用曦云 GPU。<br/> - 若无群组管理需要, 可删除此配置文件 (deb 包安装会自动创建此配置文件) |
| 5 | 虚拟化 | dmesg | grep "no space" | 确认系统是否支持 SRIOV 虚拟化 |
| 6 | IOMMU配置 | vim /etc/default/grub | 确保 IOMMU 配置生效, 添加 iommu.passthrough=1, 更新 grub 并重启系统 |
| 7 | gpu_sched模块 | modinfo gpu_sched | 确认是否缺少依赖模块, 若缺少则安装内核可选模块包 |
| 8 | 第三方驱动加载 | modprobe metax | 在 SLES 系统中, 确认是否允许第三方驱动加载 |