支持矩阵#
这些支持矩阵概述了 TensorRT API、解析器和层的支持平台、功能和硬件能力。
平台和软件的功能#
每个平台支持的功能列表# 软件
Linux x86-64
Windows x64
Linux SBSA
JetPack
10.8.x
10.8.x
10.8.x
10.7.x
NVIDIA cuDNN (可选)
TensorRT Python API
是
是
是
是
NvOnnxParser
是
是
是
是
循环
是
是
是
是
注意
序列化引擎不可跨平台移植。
如果序列化引擎是使用版本兼容标志创建的,则它可以在同一主版本内的较新版本的 TensorRT 上运行。
如果序列化引擎在启用硬件兼容模式的情况下创建,则它可以运行在多种 GPU 架构上;具体取决于使用的硬件兼容性级别。 否则,序列化引擎不可跨设备移植。
请参考 NVIDIA CUDA 发行说明 中的最低兼容驱动程序版本,以获取特定的 NVIDIA 驱动程序 版本。
硬件和精度#
下表列出了 NVIDIA 硬件以及每个硬件支持的精度模式。 TensorRT 已编译为支持所有 SM 7.5 或更高能力的 NVIDIA 硬件。 该表还列出了此硬件上 DLA 的可用性。 有关详细信息,请参阅下表。
示例设备 |
TF32 |
FP32 |
FP16 |
FP8 |
FP4 |
BF16 |
INT8 |
FP16 Tensor Cores |
INT8 Tensor Cores |
DLA |
|
---|---|---|---|---|---|---|---|---|---|---|---|
12.0 |
NVIDIA RTX 5090 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
否 |
10.0 |
NVIDIA B200 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
否 |
9.0 |
NVIDIA H100 |
是 |
是 |
是 |
是 |
是 [5] |
是 |
是 |
是 |
是 |
否 |
9.0 |
NVIDIA GH200 480 GB |
是 |
是 |
是 |
是 |
是 [5] |
是 |
是 |
是 |
是 |
否 |
8.9 |
NVIDIA L40S |
是 |
是 |
是 |
是 |
是 [5] |
是 |
是 |
是 |
是 |
否 |
8.7 |
NVIDIA DRIVE AGX Orin |
是 |
是 |
是 |
否 |
否 |
否 |
是 |
是 |
是 |
是 |
8.6 |
NVIDIA A10 |
是 |
是 |
是 |
否 |
否 |
是 |
是 |
是 |
是 |
否 |
8.0 |
NVIDIA A100 |
是 |
是 |
是 |
否 |
否 |
是 |
是 |
是 |
是 |
否 |
7.5 |
NVIDIA T4 |
否 |
是 |
是 |
否 |
否 |
否 |
是 |
是 |
是 |
否 |
每个平台的计算能力#
本节列出了基于平台的支持的计算能力。
每个平台的软件版本#
平台 |
编译器版本 |
Python 版本 |
---|---|---|
Ubuntu 20.04 x86-64 |
||
Ubuntu 22.04 x86-64 |
||
Ubuntu 24.04 x86-64 |
||
Rocky Linux 8.9 x86-64 |
||
Rocky Linux 9.3 x86-64 |
||
SLES 15 x86-64 |
N/A |
|
|
N/A |
|
Ubuntu 24.04 SBSA |
||
NVIDIA JetPack AArch64 |
注意
Debian 或 RPM 包支持表中列出的 Python 版本。 使用来自 tar 或 zip 包的 Python wheel 文件支持 Python 版本 3.8、3.9、3.10、3.11 和 3.12。
ONNX 算子支持#
TensorRT 的 ONNX 算子支持列表可以在此处找到。
脚注