diff --git a/test.md b/test.md index d0d8674..61fbc20 100644 --- a/test.md +++ b/test.md @@ -1,10 +1,10 @@ | 序号 | 检查项目 | 检查命令 | 说明 | |------|---------------------|-------------------------------|---------------------------------------------------------------------------------------------------------------| -| 1-3 | 服务器CPU架构、操作系统、内核版本 | uname -m, lsb_release -a, uname -r | 确认CPU架构、操作系统和内核版本是否在软硬件平台兼容列表中, 不匹配则需更新环境 | -| 4 | 系统是否安装过驱动 | lsmod | grep metax | - 若无内容显示, 表示未安装软件包, 可直接安装
- 若有内容显示, 表示已安装, 需要卸载后再安装 | -| 5 | 板卡是否在位 | lspci | grep 9999 | 确认GPU板卡正常在位, 含“9999”的行数应与板卡数量匹配 | -| 6 | udev 配置 | cat /etc/udev/rules.d/70-metax.rules | - 若有群组管理需要:
只允许 video 组的成员使用曦云 GPU, 则配置文件有如下内容:
KERNEL=="mxcd", GROUP="video", MODE="0660"
KERNEL=="renderD[0-9]*", GROUP="video", MODE="0660"
- 若没有以上内容, 则表示只有 root 用户可以使用曦云 GPU。
- 若无群组管理需要, 可删除此配置文件 (deb 包安装会自动创建此配置文件) | -| 7 | 虚拟化 | dmesg | grep "no space" | 确认系统是否支持 SRIOV 虚拟化 | -| 8 | IOMMU配置 | vim /etc/default/grub | 确保 IOMMU 配置生效, 添加 iommu.passthrough=1, 更新 grub 并重启系统 | -| 9 | gpu_sched模块 | modinfo gpu_sched | 确认是否缺少依赖模块, 若缺少则安装内核可选模块包 | -| 10 | 第三方驱动加载 | modprobe metax | 在 SLES 系统中, 确认是否允许第三方驱动加载 | +| 1 | 服务器CPU架构、操作系统、内核版本 | uname -m, lsb_release -a, uname -r | 确认CPU架构、操作系统和内核版本是否在软硬件平台兼容列表中, 不匹配则需更新环境 | +| 2 | 系统是否安装过驱动 | lsmod | grep metax | - 若无内容显示, 表示未安装软件包, 可直接安装
- 若有内容显示, 表示已安装, 需要卸载后再安装 | +| 3 | 板卡是否在位 | lspci | grep 9999 | 确认GPU板卡正常在位, 含“9999”的行数应与板卡数量匹配 | +| 4 | udev 配置 | cat /etc/udev/rules.d/70-metax.rules | - 若有群组管理需要:
只允许 video 组的成员使用曦云 GPU, 则配置文件有如下内容:
KERNEL=="mxcd", GROUP="video", MODE="0660"
KERNEL=="renderD[0-9]*", GROUP="video", MODE="0660"
- 若没有以上内容, 则表示只有 root 用户可以使用曦云 GPU。
- 若无群组管理需要, 可删除此配置文件 (deb 包安装会自动创建此配置文件) | +| 5 | 虚拟化 | dmesg | grep "no space" | 确认系统是否支持 SRIOV 虚拟化 | +| 6 | IOMMU配置 | vim /etc/default/grub | 确保 IOMMU 配置生效, 添加 iommu.passthrough=1, 更新 grub 并重启系统 | +| 7 | gpu_sched模块 | modinfo gpu_sched | 确认是否缺少依赖模块, 若缺少则安装内核可选模块包 | +| 8 | 第三方驱动加载 | modprobe metax | 在 SLES 系统中, 确认是否允许第三方驱动加载 |