首次启动设置#
本节提供有关首次启动 NVIDIA DGX™ B200 系统后的设置过程的信息。
虽然 NVIDIA 合作伙伴网络人员或 NVIDIA 现场服务工程师将在现场安装 DGX B200 系统并执行首次启动设置,但此处提供首次启动设置说明,以供参考并支持服务器的任何重置映像。
系统设置#
这些说明描述了 DGX B200 系统在交付后或服务器重新映像后首次开机时发生的设置过程。
请准备好接受所有最终用户许可协议 (EULA) 并设置您的用户名和密码。要预览 EULA,请访问 企业软件协议 页面,然后在NVIDIA AI、DGX 和 NVIDIA AI Enterprise下点击 NVIDIA 软件许可协议。
按照 连接到控制台 中的说明连接到 DGX B200 控制台。
通过以下方式之一启动 DGX B200 系统
使用物理电源按钮。
使用远程 BMC
有关以下主题的信息,请参阅NVIDIA DGX OS 7 用户指南中的 DGX 服务器的首次启动过程
(可选)加密根文件系统。
使用首次启动向导设置语言、区域设置、国家/地区等。
为系统、BMC 和 Grub 引导加载程序创建管理用户帐户。
配置主网络接口。
设置后任务#
本节介绍在初始系统首次启动设置后建议执行的任务。
注意
RAID 1 重建可能会暂时影响系统性能。
当系统在还原映像并运行首次启动设置后启动时,软件 RAID 开始重建 RAID 1 阵列,这将创建包含软件的驱动器的镜像(或重新同步)。在 RAID 1 重建过程中,系统性能可能会受到影响。此过程可能需要一个小时才能完成。
在此期间,运行 nvsm show health
命令会报告警告,指出 RAID 卷正在重新同步。
您可以通过运行 sudo nvsm show volumes
命令来监控 RAID 1 重建过程的状态,然后在 /systems/localhost/storage/volumes/md0/rebuild
下查看输出。
获取软件更新#
为确保您运行的是最新版本的 DGX OS,您可能需要更新软件。
更新软件可确保您的 DGX B200 系统包含重要更新,包括安全更新。Ubuntu 安全公告站点 https://usn.ubuntu.com/ 列出了已知的常见漏洞和暴露 (CVE),包括那些可以通过更新 DGX OS 软件解决的漏洞。
有关更新操作系统的信息,请参阅NVIDIA DGX OS 7 用户指南中的 升级操作系统。
启用 SRP 守护程序#
NVIDIA 网络驱动程序提供 SRP 守护程序软件。默认情况下,该守护程序处于禁用状态。如果要通过 InfiniBand 使用 RDMA,则需要启用该守护程序。您可以通过运行以下命令来启用守护程序
sudo systemctl enable srp_daemon.service
sudo systemctl enable srptools.service