Update test
parent
5f92c55b72
commit
8d0ba7db87
16
test.md
16
test.md
@ -1,10 +1,12 @@
|
|||||||
### 环境检查(如无特别说明,以Ubuntu 18.04为例)
|
|
||||||
|
|
||||||
| 序号 | 检查项目 | 检查命令 | 说明 |
|
| 序号 | 检查项目 | 检查命令 | 说明 |
|
||||||
|------|---------------------|-------------------------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
|
|------|---------------------|-------------------------------|---------------------------------------------------------------------------------------------------------------|
|
||||||
| 1 | 服务器CPU架构 | uname -m | 对照表 3.1 软硬件平台兼容列表,确认 CPU 架构、操作系统和内核版本是否在列表中。若有任何一项不匹配,则需更新环境。详细信息参见 3.2.1 确认服务器架构,操作系统和内核版本。 |
|
| 1 | 服务器CPU架构 | uname -m | 确认CPU架构、操作系统和内核版本是否在软硬件平台兼容列表中,不匹配则需更新环境 |
|
||||||
| 2 | 操作系统 | lsb_release -a | |
|
| 2 | 操作系统 | lsb_release -a | |
|
||||||
| 3 | 内核版本 | uname -r | |
|
| 3 | 内核版本 | uname -r | |
|
||||||
| 4 | 系统是否安装过驱动 | lsmod \| grep metax | 若无内容显示,则表示未安装过软件包。可以直接安装软件包。<br/>- 若有内容显示,则表示安装过软件包。需要先卸载驱动包,再安装新版本软件包。卸载驱动包,请参见 3.2.5 卸载驱动。 |
|
| 4 | 系统是否安装过驱动 | lsmod | grep metax | - 若无内容显示,表示未安装软件包,可直接安装<br/>- 若有内容显示,表示已安装,需要卸载后再安装 |
|
||||||
| 5 | 板卡是否正常在位 | lspci grep 9999 | 如果服务器上有 N(N>0)张曦云 GPU 板卡,回显中含 "9999" 字段的行数为 N 时,则表示曦云 GPU 板卡正常在位。例如,若服务器上有 2 张板卡且都正常在位,则回显信息如下所示:<br/>01:00.0 Display controller: Device 9999:4000 (rev 01)<br/>02:00.0 Display controller: Device 9999:4000 (rev 01) |
|
| 5 | 板卡是否在位 | lspci | grep 9999 | 确认GPU板卡正常在位,含“9999”的行数应与板卡数量匹配 |
|
||||||
|
| 6 | udev 配置 | cat /etc/udev/rules.d/70-metax.rules | - 若有群组管理需要:\n 只允许 video 组的成员使用曦云 GPU,则配置文件有如下内容:\n KERNEL=="mxcd", GROUP="video", MODE="0660"\n KERNEL=="renderD[0-9]*", GROUP="video", MODE="0660"\n - 若没有以上内容,则表示只有 root 用户可以使用曦云 GPU。\n - 若无群组管理需要,可删除此配置文件。(deb 包安装会自动创建此配置文件) |
|
||||||
|
| 7 | 虚拟化 | dmesg | grep "no space" | 确认系统是否支持 SRIOV 虚拟化 |
|
||||||
|
| 8 | IOMMU配置 | vim /etc/default/grub | 确保 IOMMU 配置生效,添加 iommu.passthrough=1,更新 grub 并重启系统 |
|
||||||
|
| 9 | gpu_sched模块 | modinfo gpu_sched | 确认是否缺少依赖模块,若缺少则安装内核可选模块包 |
|
||||||
|
| 10 | 第三方驱动加载 | modprobe metax | 在 SLES 系统中,确认是否允许第三方驱动加载 |
|
||||||
|
Loading…
Reference in New Issue
Block a user