Audio2Face-3D NIM 文档#
概述#
NVIDIA Audio2Face-3D NIM (A2F-3D NIM) 提供基于音频和情感输入的先进生成式 AI 头像动画解决方案。它是 NVIDIA ACE 的核心组件,能够创建智能的、情感丰富的数字人。
凭借对实时语音到面部动画和情感驱动表情的支持,A2F-3D NIM 为游戏、虚拟助手、教育等领域的交互式、栩栩如生的数字人提供动力。
功能特性#
使用 Audio2Face-3D NIM,您可以:
语音到面部动画:使用 ARKit blendshapes 将音频输入转换为栩栩如生的面部动画。
情感检测和控制:自动检测音频中的情感基调或直接指定情感。
多用户工作流:支持同步输入流,实现协作或大规模部署。
灵活集成:输出与渲染引擎兼容的 blendshape 拓扑,实现无缝的 3D 角色表演。
有关详细信息,请访问 Audio2Face-3D NIM 开发者文档 。
入门指南#
设置指南:按照 入门指南 中的步骤进行本地部署的安装和配置。
支持矩阵:请参阅 Audio2Face-3D NIM 支持矩阵 ,获取关于优化硬件、模型和软件堆栈的详细兼容性信息。
演示:在部署之前体验 Audio2Face-3D NIM 实时演示,请访问 build.nvidia.com。