配置存储 - NFS 挂载和缓存#
默认情况下,DGX 系统包含多个 SSD 固态硬盘,采用 RAID 配置(DGX-1 中为 4 个 SSD,DGX-2 中为 8 或 16 个 SSD,DGX Station 中为 3 个 SSD)。这些 SSD 固态硬盘旨在用于应用程序缓存,因此 NVIDIA 建议您设置自己的 NFS 存储用于长期数据存储。以下说明介绍如何将 NFS 挂载到 DGX 系统,以及如何使用 DGX SSD 缓存 NFS 以提高性能。
确保您拥有一个 NFS 服务器,其中包含一个或多个导出目录,DGX 系统可以访问这些目录中的数据,并且 DGX 系统和 NFS 服务器之间存在网络连接。
安装 nfs 软件包。
$ sudo yum install nfs-utils
为 DGX 配置 NFS 挂载。
编辑文件系统表配置。
sudo vi /etc/fstab
为 NFS 挂载添加新行,使用本地挂载点
/mnt
。<nfs_server>:<export_path> /mnt nfs rw,noatime,rsize=32768,wsize=32768,nolock,tcp,intr,fsc,nofail 0 0
/mnt
在此处用作示例挂载点。请咨询您的网络管理员,以获取 <
nfs_server
> 和 <export_path
> 的正确值。此处提供的 nfs 参数是基于典型用例的推荐值列表。但是,“fsc” 必须始终包含在内,因为该参数指定使用 FS-Cache。
保存更改。
验证 NFS 服务器是否可访问。
ping <nfs_server>
使用服务器 IP 地址或您的网络管理员提供的服务器名称。
挂载 NFS 导出目录。
sudo mount /mnt
/mnt 是步骤 1 中使用的示例挂载点。
验证缓存是否已启用。
cat /proc/fs/nfsfs/volumes
在输出中查找文本
FSC=yes
。NFS 将在后续重启周期中自动挂载并在 DGX 系统上缓存。