SiameseOI 与 TAO Deploy
为了生成优化的 TensorRT 引擎,需要将 SiameseOI .etlt
或 .onnx
文件作为输入,该文件首先使用 tao model visual_changenet export
生成,然后输入到 tao deploy visual_changenet gen_trt_engine
。 有关训练 SiameseOI 模型的更多信息,请参阅 SiameseOI 训练文档。
gen_trt_engine
实验规范文件中的 gen_trt_engine
部分提供了从 .etlt
或 .onnx
文件生成 TensorRT 引擎的选项。 以下是一个配置示例
gen_trt_engine:
results_dir: "${results_dir}/gen_trt_engine"
onnx_file: "${results_dir}/export/oi_model.onnx"
trt_engine: "${results_dir}/gen_trt_engine/oi_model.trt.v100"
input_channel: 3
input_width: 400
input_height: 100
tensorrt:
data_type: fp32
workspace_size: int = 1024
min_batch_size: int = 1
opt_batch_size: int = 1
max_batch_size: int = 1
参数 | 数据类型 | 默认值 | 描述 | 支持的值 |
results_dir |
string | – | 结果目录的路径 | – |
onnx_file |
string | – | 导出的 ETLT 或 ONNX 模型的路径 | – |
trt_engine |
string | – | 生成的 TensorRT 引擎的绝对路径 | – |
input_channel |
unsigned int | 3 | 输入通道大小。 仅支持值 3。 | 3 |
input_width |
unsigned int | 400 | 输入宽度 | >0 |
input_height |
unsigned int | 100 | 输入高度 | >0 |
batch_size |
unsigned int | -1 | ONNX 模型的批大小 | >=-1 |
tensorrt
tensorrt
参数定义 TensorRT 引擎生成。
参数 | 数据类型 | 默认值 | 描述 | 支持的值 |
data_type |
string | fp32 | 用于 TensorRT 引擎的精度 | fp32/fp16/int8 |
workspace_size |
unsigned int | 1024 | TensorRT 引擎的最大工作区大小 | >1024 |
min_batch_size |
unsigned int | 1 | 用于优化配置文件形状的最小批大小 | >0 |
opt_batch_size |
unsigned int | 1 | 用于优化配置文件形状的最佳批大小 | >0 |
max_batch_size |
unsigned int | 1 | 用于优化配置文件形状的最大批大小 | >0 |
使用以下命令运行 SiameseOI 引擎生成
tao deploy optical_inspection gen_trt_engine -e /path/to/spec.yaml \
results_dir=/path/to/etlt/file \
gen_trt_engine.onnx_file=/path/to/onnx/file \
gen_trt_engine.trt_engine=/path/to/engine/file \
gen_trt_engine.tensorrt.data_type=<data_type>
必需参数
-e, --experiment_spec_file
:实验规范文件的路径results_dir
:全局结果目录。 引擎生成日志将保存在results_dir
中。gen_trt_engine.onnx_file
:要转换的.onnx
模型gen_trt_engine.trt_engine
:将存储生成引擎的路径gen_trt_engine.tensorrt.data_type
:要导出的精度
示例用法
以下是使用 gen_trt_engine
命令生成 FP16 TensorRT 引擎的示例
tao deploy optical_inspection gen_trt_engine -e $DEFAULT_SPEC
results_dir=$RESULTS_DIR
gen_trt_engine.onnx_file=$ONNX_FILE \
gen_trt_engine.trt_engine=$ENGINE_FILE \
gen_trt_engine.tensorrt.data_type=FP16
您可以重用为 TAO 推理指定的规范文件。 以下是一个推理规范示例
inference:
gpu_id: 0
trt_engine: /path/to/engine/file
results_dir: "${results_dir}/inference"
使用以下命令运行 SiameseOI 引擎推理
tao deploy optical_inspection inference -e /path/to/spec.yaml \
results_dir=$RESULTS_DIR \
必需参数
-e, --experiment_spec_file
:实验规范文件的路径results_dir
:全局结果目录。 引擎生成日志将保存在results_dir
中。
示例用法
以下是使用 inference
命令通过 TensorRT 引擎运行推理的示例
tao deploy optical_inspection inference -e $DEFAULT_SPEC
results_dir=$RESULTS_DIR