重要提示

您正在查看 NeMo 2.0 文档。此版本对 API 和新的库 NeMo Run 进行了重大更改。我们目前正在将 NeMo 1.0 中的所有功能移植到 2.0。有关先前版本或 2.0 中尚未提供的功能的文档,请参阅 NeMo 24.07 文档

NeMo-Run 文档#

NeMo-Run 是一个强大的工具,旨在简化跨各种计算环境的机器学习实验的配置、执行和管理。NeMo Run 有三个核心职责

  1. 配置

  2. 执行

  3. 管理

请点击每个链接以了解更多信息。这也是 Nemo Run 用户设置和启动实验的典型顺序。

安装#

要安装该项目,请使用以下命令

pip install git+https://github.com/NVIDIA/NeMo-Run.git

要安装 Skypilot,我们提供了可选功能。

pip install git+https://github.com/NVIDIA/NeMo-Run.git[skypilot] 将安装带有 Kubernetes 的 Skypilot

pip install git+https://github.com/NVIDIA/NeMo-Run.git[skypilot-all] 将安装带有所有云的 Skypilot

您也可以从 https://skypilot.readthedocs.io/en/latest/getting-started/installation.html 手动安装 Skypilot

请确保您已正确安装并配置 pip

教程#

hello_world 教程系列全面介绍了 NeMo Run,通过一个简单的示例演示了其功能。本教程涵盖了

  • 使用 PartialConfig 类配置 Python 函数。

  • 在本地和远程集群上执行配置的函数。

  • 使用 graphviz 可视化配置。

  • 使用 run.Experiment 创建和管理实验。

您可以在下面找到教程系列

  1. 第 1 部分

  2. 第 2 部分

  3. 第 3 部分