Audio2Face-3D NIM 文档#

概述#

NVIDIA Audio2Face-3D NIM (A2F-3D NIM) 提供基于音频和情感输入的先进生成式 AI 头像动画解决方案。它是 NVIDIA ACE 的核心组件，能够创建智能的、情感丰富的数字人。

凭借对实时语音到面部动画和情感驱动表情的支持，A2F-3D NIM 为游戏、虚拟助手、教育等领域的交互式、栩栩如生的数字人提供动力。

功能特性#

使用 Audio2Face-3D NIM，您可以：

语音到面部动画：使用 ARKit blendshapes 将音频输入转换为栩栩如生的面部动画。
情感检测和控制：自动检测音频中的情感基调或直接指定情感。
多用户工作流：支持同步输入流，实现协作或大规模部署。
灵活集成：输出与渲染引擎兼容的 blendshape 拓扑，实现无缝的 3D 角色表演。

有关详细信息，请访问 Audio2Face-3D NIM 开发者文档。

入门指南#

设置指南：按照入门指南中的步骤进行本地部署的安装和配置。
支持矩阵：请参阅 Audio2Face-3D NIM 支持矩阵，获取关于优化硬件、模型和软件堆栈的详细兼容性信息。
演示：在部署之前体验 Audio2Face-3D NIM 实时演示，请访问 build.nvidia.com。