重要提示
您正在查看 NeMo 2.0 文档。此版本为 API 和新库 NeMo Run 引入了重大更改。我们目前正在将所有功能从 NeMo 1.0 移植到 2.0。有关先前版本或 2.0 中尚未提供的功能的文档,请参阅 NeMo 24.07 文档。
开始使用#
NeMo Curator 提供了许多工具,用于管理大规模文本-图像对数据集,以训练生成式图像模型。
安装 NeMo Curator#
要安装 NeMo Curator 的图像管理模块,请确保您满足以下要求
Python 3.10 或更高版本 * packaging >= 22.0
Ubuntu 22.04/20.04
NVIDIA GPU * Volta™ 或更高版本(计算能力 7.0+) * CUDA 12(或更高版本)
注意:虽然一些基于文本的 NeMo Curator 模块不需要 GPU,但所有图像管理模块都需要 GPU。
您可以通过 3 种方式获取 NeMo Curator。
PyPi
源代码
NeMo 框架容器
PyPi#
NeMo Curator 的 PyPi 页面可以在此处找到。
pip install nemo-curator[image]
源代码#
NeMo Curator 的 GitHub 可以在此处找到。
git clone https://github.com/NVIDIA/NeMo-Curator.git
pip install ./NeMo-Curator[image]
NeMo 框架容器#
NeMo Curator 预装在 NeMo 框架容器中。您可以在此处找到所有 NeMo 框架容器标签的列表。
使用 NeMo Curator#
NeMo Curator 可以在本地或各种计算平台(Slurm、k8s 等)上运行。
要开始使用 NeMo Curator 中的图像模块,我们建议您查看以下资源