用户身份验证

为了使 DGX 有用,需要以某种方式将用户添加到系统中,以便他们可以通过身份验证来使用系统。通常,这被称为用户身份验证。实现此目的有几种不同的方法,但是,每种方法都有其自身的优点和缺点。

本地

第一种方法是使用 useradd 命令直接在 DGX 系统上创建用户。假设您要添加用户 dgxuser。您将首先通过以下命令添加用户。
$ useradd -m -s /bin/bash dgxuser
其中 -s 指的是用户的默认 shell,-m 创建用户的 home 目录。创建用户后,您需要将他们添加到 DGX 上的 docker 组。
$ sudo usermod -aG docker dgxuser

这会将用户 dgxuser 添加到 docker 组。任何运行 Docker 容器的用户都必须是此组的成员。

DGX 上使用身份验证很简单,但并非没有问题。首先,在 DGX 上进行操作系统升级时,有时需要重新格式化设备中的所有驱动器。如果发生这种情况,您首先必须确保在升级之前将所有用户数据复制到 DGX-1 之外的某个位置。其次,您将必须重新创建用户并将他们添加到 docker 组,并将他们的 home 数据复制回 DGX。这会增加升级系统的工作量和时间。
重要提示: 虽然 DGX-2 上的 2 个 960GB NVMe SSD 旨在用于操作系统分区,但它们采用 RAID-1 配置,但 DGX-1 和 DGX Station 的操作系统驱动器上没有 RAID-1。 因此,如果 DGX-1 或 DGX Station 上的操作系统驱动器发生故障,您将丢失所有用户以及 /home 目录中的所有内容。 因此,强烈建议您备份 DGX 系统上的相关文件以及用户的 /home

NIS 与 NIS+

另一种身份验证选项是使用 NIS 或 NIS+。 在这种情况下,DGX 将是 NIS/NIS+ 配置中的客户端。 与前面讨论的使用本地身份验证一样,DGX 中的操作系统驱动器有可能在升级期间被覆盖(并非所有升级都会重新格式化驱动器,但这是有可能的)。 这意味着管理员可能需要在 DGX 上重新安装 NIS 配置。

此外,请记住 DGX-1 和 DGX Station 只有一个操作系统驱动器。 如果此驱动器发生故障,管理员将必须重新配置 NIS/NIS+ 配置,因此,建议进行备份;即使对于 DGX-2 系统,它们确实在 RAID-1 配置中具有 2 个操作系统驱动器。
注意: 在不太可能需要 DGX 技术支持的情况下,NVIDIA 工程师可能会要求管理员断开与 NIS/NIS+ 服务器的连接。

LDAP

第三种身份验证选项是 LDAP(轻型目录访问协议)。 它在集群领域,特别是对于 Linux,已变得非常流行。 您可以在 DGX 上配置 LDAP,以从 LDAP 服务器获取用户信息和身份验证。 但是,与 NIS 一样,也可能存在影响。
注意
  • 首先,操作系统驱动器是 DGX-1 和 DGX Station 上的单个驱动器。 如果驱动器发生故障,您将必须重建 LDAP 配置(强烈建议备份)。
  • 其次,如前所述,在不太可能需要技术支持的情况下,可能会要求您断开 DGX 系统与 LDAP 服务器的连接,以便可以对系统进行故障排除。

Active Directory

用户身份验证的另一种选择是将 DGX 系统连接到 Active Directory (AD) 服务器。 这可能需要系统管理员在 DGX 中安装一些额外的工具。 这意味着这种方法也应包括之前重复的两点注意事项,即单个操作系统驱动器可能会在升级时重新格式化,或者可能会发生故障(再次强调,强烈建议备份)。 这也意味着,在不太可能需要 NVIDIA 技术支持的情况下,可能会要求您将系统从 AD 网络中移除,并删除任何添加的软件(这种情况不太可能但有可能发生)。