Update MACA

mirror 2024-10-12 13:41:22 +08:00
parent 32025f6c2c
commit a897d9f6ae

18
MACA.md

@ -105,27 +105,11 @@
| x86_64 | KeyarchOS 5.8 | 4.19.91-27.4.19.kos5.x86_64 | 支持 | | x86_64 | KeyarchOS 5.8 | 4.19.91-27.4.19.kos5.x86_64 | 支持 |
# 环境检查如无特别说明以Ubuntu 18.04为例)
| 序号 | 检查项目 | 检查命令 | 说明 |
|------|---------------------|-------------------------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| 1 | 服务器CPU架构 | `uname -m` | 对照表3 1软硬件平台兼容列表确认CPU架构、操作系统和内核版本是否在列表中。若有任何一项不匹配则需更新环境。详细信息参见3.2.1确认服务器架构,操作系统和内核版本。 |
| 2 | 操作系统 | `lsb_release -a` | |
| 3 | 内核版本 | `uname -r` | |
| 4 | 系统是否安装过驱动 | `lsmod | grep metax` | - 若无内容显示,则表示未安装过软件包。可以直接安装软件包。<br/>- 若有内容显示则表示安装过软件包。需要先卸载驱动包再安装新版本软件包。卸载驱动包请参见3.2.5卸载驱动。 |
| 5 | 板卡是否正常在位 | `lspci | grep 9999` | 如果服务器上有NN0张曦云GPU板卡回显中含“9999”字段的行数为N时则表示曦云GPU板卡正常在位。例如若服务器上有2张板卡且都正常在位则回显信息如下所示<br/>01:00.0 Display controller: Device 9999:4000 (rev 01)<br/>02:00.0 Display controller: Device 9999:4000 (rev 01) |
| 6 | udev配置 | `cat /etc/udev/rules.d/70-metax.rules` | - 若有群组管理需要:<br/>只允许video组的成员使用曦云GPU则配置文件有如下内容<br/>KERNEL=="mxcd", GROUP="video", MODE="0660"<br/>KERNEL=="renderD[0-9]*", GROUP="video", MODE="0660"<br/>- 若没有以上内容则表示只有root用户可以使用曦云GPU。<br/>- 若无群组管理需要可删除此配置文件。deb包安装会自动创建此配置文件。 |
| 7 | 虚拟化 | `dmesg | grep "no space"` | 支持SRIOV功能的曦云系列GPU板卡需要分配额外的PCI BAR空间给VFVF所需BAR空间的大小是PF的8倍如果系统无法分配地址空间对应的设备将无法正常工作。 |
| 8 | IOMMU配置 | `vim /etc/default/grub` | - 在`GRUB_CMDLINE_LINUX=""`里面添加`iommu.passthrough=1`<br/>- 执行`sudo update-grub`<br/>- 重启系统,查看`/proc/cmdline`,确保改动生效 |
| 9 | gpu_sched模块 | `modinfo gpu_sched` | - 如果加载metax驱动过程中出现`Unknown symbol drm_sched_xxx`字样说明缺少依赖的gpu_sched模块<br/>- 安装内核可选软件包支持deb的系统执行`apt install linux-modules-extra-$(uname -r)`支持rpm的系统执行`yum install kernel-modules-extra`<br/>- 重启系统 |
| 10 | 是否允许第三方驱动加载仅适用于SLES-15系统 | `modprobe metax` | 对于SLES-15系统如在加载metax驱动时提示`module metax is unsupported`,则需使用`modprobe metax --allow-unsupported`命令加载。如需开机自动加载metax驱动则需添加`/etc/modprobe.d/10-unsupported-modules.conf`文件,并在该文件中填写`allow_unsupported_modules 1`。 |
### 环境检查如无特别说明以Ubuntu 18.04为例) ### 环境检查如无特别说明以Ubuntu 18.04为例)
| 序号 | 检查项目 | 检查命令 | 说明 | | 序号 | 检查项目 | 检查命令 | 说明 |
|------|---------------------|-------------------------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------| |------|---------------------|-------------------------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| 1 | 服务器CPU架构 | `uname -m` | 对照表3 1软硬件平台兼容列表确认CPU架构、操作系统和内核版本是否在列表中。若有任何一项不匹配则需更新环境。详细信息参见3.2.1确认服务器架构,操作系统和内核版本。 | | 1 | 服务器CPU架构 | `uname -m` | 对照表3 1软硬件平台兼容列表,确认CPU架构,操作系统和内核版本是否在列表中。若有任何一项不匹配则需更新环境。详细信息参见3.2.1确认服务器架构,操作系统和内核版本。 |
| 2 | 操作系统 | `lsb_release -a` | | | 2 | 操作系统 | `lsb_release -a` | |
| 3 | 内核版本 | `uname -r` | | | 3 | 内核版本 | `uname -r` | |
| 4 | 系统是否安装过驱动 | `lsmod | grep metax` | - 若无内容显示,则表示未安装过软件包。可以直接安装软件包。<br/>- 若有内容显示则表示安装过软件包。需要先卸载驱动包再安装新版本软件包。卸载驱动包请参见3.2.5卸载驱动。 | | 4 | 系统是否安装过驱动 | `lsmod | grep metax` | - 若无内容显示,则表示未安装过软件包。可以直接安装软件包。<br/>- 若有内容显示则表示安装过软件包。需要先卸载驱动包再安装新版本软件包。卸载驱动包请参见3.2.5卸载驱动。 |