重要提示

您正在查看 NeMo 2.0 文档。此版本对 API 和一个新库 NeMo Run 进行了重大更改。我们目前正在将 NeMo 1.0 的所有功能移植到 2.0。有关先前版本或 2.0 中尚不可用的功能的文档，请参阅 NeMo 24.07 文档。

教程#

开始使用 NeMo 的最佳方式是从我们的教程之一开始。这些教程涵盖了各个领域，并提供入门和高级主题。它们旨在帮助您有效理解和使用 NeMo 工具包。

在 Colab 上运行教程#

大多数 NeMo 教程都可以在 Google Colab 上运行。

运行教程：

从下表中，点击您感兴趣的教程关联的 Colab 链接。
进入 Colab 后，通过点击 Runtime > Change runtime type 并选择 GPU 作为硬件加速器，连接到具有 GPU 的实例。

**通用教程**#
领域	标题	GitHub URL
通用	入门指南：NeMo 基础知识	NeMo 基础知识
通用	入门指南：音频翻译器示例	音频翻译器示例
通用	入门指南：声音交换示例	声音交换示例
通用	入门指南：NeMo 模型	NeMo 模型
通用	入门指南：NeMo 适配器	NeMo 适配器
通用	入门指南：Hugging Face Hub 上的 NeMo 模型	HF Hub 上的 NeMo 模型

**多模态教程**#
领域	标题	GitHub URL
多模态	准备和高级应用：多模态数据准备	多模态数据准备
多模态	准备和高级应用：NeVA (LLaVA) 教程	NeVA (LLaVA) 教程
多模态	准备和高级应用：Stable Diffusion 教程	Stable Diffusion 教程
多模态	准备和高级应用：DreamBooth 教程	DreamBooth 教程
多模态	准备和高级应用：Stable Diffusion XL 量化教程	SDXL 量化教程

**文本到语音 (TTS) 教程**#
领域	标题	GitHub URL
TTS	基础和高级：NeMo TTS 入门	NeMo TTS 入门
TTS	基础和高级：TTS 语音/文本对齐器推理	TTS 语音/文本对齐器推理
TTS	基础和高级：FastPitch 和 MixerTTS 模型训练	FastPitch 和 MixerTTS 模型训练
TTS	基础和高级：FastPitch 微调	FastPitch 微调
TTS	基础和高级：用于德语的 FastPitch 和 HiFiGAN 模型训练	用于德语的 FastPitch 和 HiFiGAN 模型训练
TTS	基础和高级：Tacotron2 模型训练	Tacotron2 模型训练
TTS	基础和高级：FastPitch 持续时间和音调控制	FastPitch 持续时间和音调控制
TTS	基础和高级：FastPitch 说话人插值	FastPitch 说话人插值
TTS	基础和高级：TTS 推理和模型选择	TTS 推理和模型选择
TTS	基础和高级：TTS 发音自定义	TTS 发音自定义

**文本处理 (TN/ITN) 教程**#
领域	标题	GitHub URL
文本处理	文本规范化技术：文本规范化	文本规范化
文本处理	文本规范化技术：使用 Thutmose Tagger 的逆文本规范化	使用 Thutmose Tagger 的逆文本规范化
文本处理	文本规范化技术：WFST 教程	WFST 教程