SiameseOI 与 TAO Deploy - NVIDIA 文档

为了生成优化的 TensorRT 引擎，需要将 SiameseOI .etlt 或 .onnx 文件作为输入，该文件首先使用 tao model visual_changenet export 生成，然后输入到 tao deploy visual_changenet gen_trt_engine。有关训练 SiameseOI 模型的更多信息，请参阅 SiameseOI 训练文档。

将 ETLT 或 ONNX 文件转换为 TensorRT 引擎

gen_trt_engine

实验规范文件中的 gen_trt_engine 部分提供了从 .etlt 或 .onnx 文件生成 TensorRT 引擎的选项。以下是一个配置示例

复制
已复制！

            
            gen_trt_engine:
  results_dir: "${results_dir}/gen_trt_engine"
  onnx_file: "${results_dir}/export/oi_model.onnx"
  trt_engine: "${results_dir}/gen_trt_engine/oi_model.trt.v100"
  input_channel: 3
  input_width: 400
  input_height: 100
  tensorrt:
    data_type: fp32
    workspace_size: int = 1024
    min_batch_size: int = 1
    opt_batch_size: int = 1
    max_batch_size: int = 1

参数	数据类型	默认值	描述	支持的值
`results_dir`	string	–	结果目录的路径	–
`onnx_file`	string	–	导出的 ETLT 或 ONNX 模型的路径	–
`trt_engine`	string	–	生成的 TensorRT 引擎的绝对路径	–
`input_channel`	unsigned int	3	输入通道大小。仅支持值 3。	3
`input_width`	unsigned int	400	输入宽度	>0
`input_height`	unsigned int	100	输入高度	>0
`batch_size`	unsigned int	-1	ONNX 模型的批大小	>=-1

tensorrt

tensorrt 参数定义 TensorRT 引擎生成。

参数	数据类型	默认值	描述	支持的值
`data_type`	string	fp32	用于 TensorRT 引擎的精度	fp32/fp16/int8
`workspace_size`	unsigned int	1024	TensorRT 引擎的最大工作区大小	>1024
`min_batch_size`	unsigned int	1	用于优化配置文件形状的最小批大小	>0
`opt_batch_size`	unsigned int	1	用于优化配置文件形状的最佳批大小	>0
`max_batch_size`	unsigned int	1	用于优化配置文件形状的最大批大小	>0

使用以下命令运行 SiameseOI 引擎生成

复制
已复制！

            
            tao deploy optical_inspection gen_trt_engine -e /path/to/spec.yaml \
           results_dir=/path/to/etlt/file \
           gen_trt_engine.onnx_file=/path/to/onnx/file \
           gen_trt_engine.trt_engine=/path/to/engine/file \
           gen_trt_engine.tensorrt.data_type=<data_type>

必需参数

-e, --experiment_spec_file：实验规范文件的路径
results_dir：全局结果目录。引擎生成日志将保存在 results_dir 中。
gen_trt_engine.onnx_file：要转换的 .onnx 模型
gen_trt_engine.trt_engine：将存储生成引擎的路径
gen_trt_engine.tensorrt.data_type：要导出的精度

示例用法

以下是使用 gen_trt_engine 命令生成 FP16 TensorRT 引擎的示例

复制
已复制！

            
            tao deploy optical_inspection gen_trt_engine -e $DEFAULT_SPEC
           results_dir=$RESULTS_DIR
           gen_trt_engine.onnx_file=$ONNX_FILE \
           gen_trt_engine.trt_engine=$ENGINE_FILE \
           gen_trt_engine.tensorrt.data_type=FP16

通过 TensorRT 引擎运行推理

您可以重用为 TAO 推理指定的规范文件。以下是一个推理规范示例

复制
已复制！

            
            inference:
  gpu_id: 0
  trt_engine: /path/to/engine/file
  results_dir: "${results_dir}/inference"

使用以下命令运行 SiameseOI 引擎推理

复制
已复制！

            
            tao deploy optical_inspection inference -e /path/to/spec.yaml \
           results_dir=$RESULTS_DIR \

必需参数

-e, --experiment_spec_file：实验规范文件的路径
results_dir：全局结果目录。引擎生成日志将保存在 results_dir 中。

示例用法

以下是使用 inference 命令通过 TensorRT 引擎运行推理的示例

复制
已复制！

            
            tao deploy optical_inspection inference -e $DEFAULT_SPEC
           results_dir=$RESULTS_DIR