TensorRTExtension#

有关支持矩阵和更多信息,请参阅官方 NVIDIA Tensorrt 文档。

  • UUID: d43f23e4-b9bf-11eb-9d18-2b7be630552b

  • 版本: 2.7.0

  • 作者: NVIDIA

  • 许可证: 专有

组件#

nvidia::gxf::TensorRtInference#

Codelet 接受输入张量并将它们馈送到 TensorRT 以进行推理。

  • 组件 ID: 06a7f0e0-b9c0-11eb-8cd6-23c9c2070107

  • 基本类型: nvidia::gxf::Codelet

参数#

model_file_path

模型文件路径。要加载的 ONNX 模型的路径。

  • 标志: GXF_PARAMETER_FLAGS_NONE

  • 类型: GXF_PARAMETER_TYPE_STRING


engine_file_path

引擎文件路径。要序列化并从中加载的生成引擎的路径。

  • 标志: GXF_PARAMETER_FLAGS_NONE

  • 类型: GXF_PARAMETER_TYPE_STRING


force_engine_update

强制引擎更新。始终更新引擎,而无需考虑现有引擎文件。这种转换可能需要几分钟。默认为 false。

  • 标志: GXF_PARAMETER_FLAGS_NONE

  • 类型: GXF_PARAMETER_TYPE_BOOL

  • 默认值: false


input_tensor_names

输入张量名称。输入张量的名称,按顺序馈送到模型中。

  • 标志: GXF_PARAMETER_FLAGS_NONE

  • 类型: GXF_PARAMETER_TYPE_STRING


input_binding_names

输入绑定名称。模型中输入绑定的名称,顺序与 input_tensor_names 中提供的顺序相同。

  • 标志: GXF_PARAMETER_FLAGS_NONE

  • 类型: GXF_PARAMETER_TYPE_STRING


output_tensor_names

输出张量名称。输出张量的名称,按顺序从模型中检索。

  • 标志: GXF_PARAMETER_FLAGS_NONE

  • 类型: GXF_PARAMETER_TYPE_STRING


output_binding_names

输出绑定名称。模型中输出绑定的名称,顺序与 output_tensor_names 中提供的顺序相同。

  • 标志: GXF_PARAMETER_FLAGS_NONE

  • 类型: GXF_PARAMETER_TYPE_STRING


pool

池。输出张量的分配器实例。

  • 标志: GXF_PARAMETER_FLAGS_NONE

  • 类型: GXF_PARAMETER_TYPE_HANDLE

  • 句柄类型: nvidia::gxf::Allocator


cuda_stream_pool

Cuda Stream Pool。gxf::CudaStreamPool 的实例,用于分配 CUDA 流。

  • 标志: GXF_PARAMETER_FLAGS_NONE

  • 类型: GXF_PARAMETER_TYPE_HANDLE

  • 句柄类型: nvidia::gxf::CudaStreamPool


max_workspace_size

最大工作区大小。工作空间的大小,以字节为单位。默认为 64MB。

  • 标志: GXF_PARAMETER_FLAGS_NONE

  • 类型: GXF_PARAMETER_TYPE_INT64

  • 默认值: 67108864


dla_core

要使用的 DLA 核心。始终启用回退到 GPU。默认为仅使用 GPU。

  • 标志: GXF_PARAMETER_FLAGS_OPTIONAL

  • 类型: GXF_PARAMETER_TYPE_INT64


max_batch_size

最大批大小。最大可能的批大小,以防第一个维度是动态的并用作批大小。

  • 标志: GXF_PARAMETER_FLAGS_NONE

  • 类型: GXF_PARAMETER_TYPE_INT32

  • 默认值: 1


enable_fp16

启用 FP16 模式。启用使用 FP16 和 FP32 回退进行推理。

  • 标志: GXF_PARAMETER_FLAGS_NONE

  • 类型: GXF_PARAMETER_TYPE_BOOL

  • 默认值: false


verbose

在控制台上启用详细日志记录。默认为 false。

  • 标志: GXF_PARAMETER_FLAGS_NONE

  • 类型: GXF_PARAMETER_TYPE_BOOL

  • 默认值: false


relaxed_dimension_check

宽松维度检查。忽略输入张量维度检查的维度 1。

  • 标志: GXF_PARAMETER_FLAGS_NONE

  • 类型: GXF_PARAMETER_TYPE_BOOL

  • 默认值: true


clock

时钟。用于发布时间的时钟实例。

  • 标志: GXF_PARAMETER_FLAGS_OPTIONAL

  • 类型: GXF_PARAMETER_TYPE_HANDLE

  • 句柄类型: nvidia::gxf::Clock


dev_id

设备 ID。在其上创建 CUDA 流的设备。

  • 标志: GXF_PARAMETER_FLAGS_OPTIONAL

  • 类型: GXF_PARAMETER_TYPE_INT32

  • 默认值: 0


rx

RX。接收器列表,用于接收输入张量。

  • 标志: GXF_PARAMETER_FLAGS_NONE

  • 类型: GXF_PARAMETER_TYPE_HANDLE

  • 句柄类型: nvidia::gxf::Receiver


tx

TX。发射器,用于发布输出张量。

  • 标志: GXF_PARAMETER_FLAGS_NONE

  • 类型: GXF_PARAMETER_TYPE_HANDLE

  • 句柄类型: nvidia::gxf::Transmitter