搜索范围
整个站点
仅本文档
清除搜索
搜索
1. 简介
1.1. 相关文档
1.2. 前提条件
1.2.1. 访问存储库
1.2.1.1. NVIDIA 存储库
1.2.1.2. CentOS 存储库
1.2.2. 网络文件系统
1.2.3. BMC 密码
2. 安装 CentOS
2.1. 获取 CentOS
2.2. 本地引导 CentOS ISO
2.3. 在 DGX-1、DGX-2 或 DGX A100 上远程引导 CentOS ISO
2.3.1. 在 DGX-1 上远程引导 ISO 镜像
2.3.2. 在 DGX-2 上远程引导 ISO 镜像
2.3.3. 在 DGX A100 上远程引导 ISO 镜像
2.4. 安装 CentOS
2.4.1. 在 DGX-1、DGX Station 或 DGX Station A100 上安装
2.4.2. 在 DGX-2 上安装
2.4.3. 在 DGX A100 上安装
3. 安装 DGX 软件
3.1. 配置系统代理
3.2. 启用存储库
3.3. 安装必需组件
3.3.1. 安装 DGX 工具并更新配置文件
3.3.2. 配置 /raid 分区
3.3.2.1. 将 /raid 分区配置为 NFS 缓存
3.3.2.2. 将 /raid 分区配置为本地持久存储
3.3.3. 安装和加载 NVIDIA CUDA 驱动程序
3.3.4. 安装 NVIDIA 容器运行时
3.4. 安装诊断组件
3.5. 在 DGX-2 或 DGX A100 上复制 EFI 系统分区
3.6. 安装可选组件
3.7. 将 NVIDIA 风格应用于桌面用户界面
3.8. 管理 CPU 缓解措施
3.8.1. 确定 DGX 系统的 CPU 缓解状态
3.8.2. 禁用 CPU 缓解措施
3.8.3. 重新启用 CPU 缓解措施
4. 使用 NVIDIA Mellanox InfiniBand 驱动程序
4.1. 确定要安装的 MLNX_OFED 版本
4.2. 安装 NVIDIA Mellanox InfiniBand 驱动程序
4.3. 更新 NVIDIA Mellanox InfiniBand 驱动程序
5. 运行容器
6. 配置存储 - NFS 挂载和缓存
A. 更改 BMC 登录名
A.1. 在 DGX-1 上更改 BMC 登录名
A.2. 在 DGX-2 或 DGX A100 上更改 BMC 登录名
B. 为 DGX Station 使用自定义 DGX 软件实用程序
B.1. 重建或重新创建 DGX Station RAID 阵列
B.2. 更改 RAID 阵列的 RAID 级别
B.3. 仅限 EL7-20.01:检查 DGX Station 的运行状况
B.4. 仅限 EL7-20.01:收集信息以对 DGX Station 进行故障排除
C. 扩展 DGX Station RAID 阵列
声明
搜索结果
(
PDF
) - 最近更新 , -
声明