NVIDIA DGX Cloud Slurm 文档#
DGX Cloud 上的 Slurm
- 1. 入门快速入门指南
- 2. 集群管理指南
- 2.1. NVIDIA DGX Cloud 概述
- 2.2. 您的集群概述
- 2.3. 集群管理概述
- 2.4. DGX Cloud 的安全性
- 2.5. DGX Cloud 集群入门
- 2.6. 以管理员身份访问您的 DGX Cloud 集群
- 2.7. 管理您的 DGX Cloud 集群
- 2.8. 故障排除
- 2.9. 请求修改您的 DGX Cloud 集群
- 2.10. 解决安全公告
- 3. 集群用户指南
- 3.1. NVIDIA DGX Cloud 概述
- 3.2. 您的集群概述
- 3.3. 访问您的 DGX Cloud 集群
- 3.4. 在您的 DGX Cloud 集群中工作概述
- 3.5. 设置以运行作业
- 3.6. 运行示例作业
- 3.7. 示例单节点交互式 Bash 作业
- 3.8. 将数据移入您的 DGX Cloud 集群
- 3.9. 管理作业
- 4. 工作负载示例
- 4.1. 在 DGX Cloud 上使用 DeepSpeed 的 PyTorch 和 Hugging Face Accelerate
- 4.2. DGX Cloud 上的 NeMo Framework
- 4.3. 在 DGX Cloud 上使用 Hugging Face Accelerate 进行视频分类和 ASR
附录
文档反馈