Riva NMT NIM 概述#

Riva NMT NIM API 提供对最先进的神经机器翻译 (NMT) 模型的轻松访问,能够以卓越的准确性将文本从一种语言翻译成另一种语言。它基于 Transformer “Big” 架构,在编码器和解码器中各有 24 层,并使用 SentencePiece 分词器。Riva NMT NIM 模型构建于 NVIDIA 软件平台之上,整合了 CUDA、TensorRT 和 Triton,以提供开箱即用的 GPU 加速。

架构#

模型架构可以在Attention is all you need.论文中找到。

企业就绪特性#

Riva NMT NIM 具有企业就绪特性,例如高性能推理服务器、灵活的集成和企业级安全性。

  • 最先进的准确性:在各种来源和领域中表现出色。

  • 开源和可扩展性:构建于 NVIDIA NeMo 之上,允许无缝集成和自定义。

  • 预训练检查点:可直接用于推理或微调的模型。

  • 宽松许可:在 CC-BY-4.0 许可下发布,模型检查点可用于任何商业应用。

试用#

Riva NMT NIM 可以在 NVIDIA NIM 上试用。