TensorRT 10.8.0
|
从网络定义构建引擎。 更多...
#include <NvInfer.h>
公共成员函数 | |
virtual | ~IBuilder () noexcept=default |
TRT_DEPRECATED bool | platformHasFastFp16 () const noexcept |
确定平台是否具有快速原生 fp16 支持。 更多... | |
TRT_DEPRECATED bool | platformHasFastInt8 () const noexcept |
确定平台是否具有快速原生 int8 支持。 更多... | |
int32_t | getMaxDLABatchSize () const noexcept |
获取 DLA 可以支持的最大批次大小。对于任何张量,索引维度(CHW 以外的维度)的总量与请求的批次大小的乘积不应超过此函数返回的值。 更多... | |
int32_t | getNbDLACores () const noexcept |
返回此构建器可用的 DLA 引擎数量。 更多... | |
void | setGpuAllocator (IGpuAllocator *allocator) noexcept |
设置 GPU 分配器。 更多... | |
nvinfer1::IBuilderConfig * | createBuilderConfig () noexcept |
创建一个构建器配置对象。 更多... | |
nvinfer1::INetworkDefinition * | createNetworkV2 (NetworkDefinitionCreationFlags flags) noexcept |
创建一个网络定义对象。 更多... | |
nvinfer1::IOptimizationProfile * | createOptimizationProfile () noexcept |
创建一个新的优化配置文件。 更多... | |
void | setErrorRecorder (IErrorRecorder *recorder) noexcept |
为此接口设置 ErrorRecorder。 更多... | |
IErrorRecorder * | getErrorRecorder () const noexcept |
获取分配给此接口的 ErrorRecorder。 更多... | |
void | reset () noexcept |
将构建器状态重置为默认值。 更多... | |
TRT_DEPRECATED bool | platformHasTf32 () const noexcept |
确定平台是否具有 TF32 支持。 更多... | |
nvinfer1::IHostMemory * | buildSerializedNetwork (INetworkDefinition &network, IBuilderConfig &config) noexcept |
为给定的 INetworkDefinition 和 IBuilderConfig 构建并序列化网络。 更多... | |
nvinfer1::ICudaEngine * | buildEngineWithConfig (INetworkDefinition &network, IBuilderConfig &config) noexcept |
为给定的 INetworkDefinition 和 IBuilderConfig 构建网络。 更多... | |
bool | isNetworkSupported (INetworkDefinition const &network, IBuilderConfig const &config) const noexcept |
检查网络是否在 IBuilderConfig 设置的范围内。 更多... | |
ILogger * | getLogger () const noexcept |
获取创建构建器时使用的 logger 更多... | |
bool | setMaxThreads (int32_t maxThreads) noexcept |
设置最大线程数。 更多... | |
int32_t | getMaxThreads () const noexcept |
获取构建器可以使用的最大线程数。 更多... | |
IPluginRegistry & | getPluginRegistry () noexcept |
获取构建器可以使用的本地插件注册表。 更多... | |
受保护的属性 | |
apiv::VBuilder * | mImpl |
附加的继承成员 | |
![]() | |
INoCopy ()=default | |
virtual | ~INoCopy ()=default |
INoCopy (INoCopy const &other)=delete | |
INoCopy & | operator= (INoCopy const &other)=delete |
INoCopy (INoCopy &&other)=delete | |
INoCopy & | operator= (INoCopy &&other)=delete |
从网络定义构建引擎。
|
virtualdefaultnoexcept |
|
inlinenoexcept |
为给定的 INetworkDefinition 和 IBuilderConfig 构建网络。
network | Network definition. |
config | 构建器配置。 |
config.getProfileStream()
返回的 CUDA 流。BuilderFlag::kVERSION_COMPATIBLE
。请使用 buildSerializedNetwork
获取版本兼容的引擎。
|
inlinenoexcept |
为给定的 INetworkDefinition 和 IBuilderConfig 构建并序列化网络。
此函数允许构建和序列化网络,而无需创建引擎。
network | Network definition. |
config | 构建器配置。 |
config.getProfileStream()
返回的 CUDA 流。
|
inlinenoexcept |
创建一个构建器配置对象。
|
inlinenoexcept |
创建一个网络定义对象。
使用 flags 参数指定的不可变属性创建网络定义对象。
createNetworkV2 支持使用 NetworkDefinitionCreationFlags 中的属性创建网络。
CreateNetworkV2 默认支持动态形状和显式批次维度。
带有 NetworkDefinitionCreationFlag::kSTRONGLY_TYPED 标志的 createNetworkV2 支持创建强类型计划,其中张量数据类型从网络输入类型和运算符类型规范推断而来。
flags | NetworkDefinitionCreationFlags 的位集,指定使用按位 OR 组合的网络属性。例如,1U << NetworkDefinitionCreationFlag::kSTRONGLY_TYPED |
|
inlinenoexcept |
创建一个新的优化配置文件。
如果网络有任何动态输入张量,则必须进行适当的 setDimensions() 调用。 同样,如果有任何形状输入张量,则需要适当的 setShapeValues() 调用。 构建器保留对创建的优化配置文件的所有权并返回原始指针,即用户不得尝试删除返回的指针。
|
inlinenoexcept |
获取分配给此接口的 ErrorRecorder。
检索给定类已分配的错误记录器对象。 如果尚未调用 setErrorRecorder,则将返回 nullptr。
|
inlinenoexcept |
获取创建构建器时使用的 logger
|
inlinenoexcept |
获取 DLA 可以支持的最大批次大小。 对于任何张量,索引维度(CHW 以外的维度)的总量与请求的批次大小的乘积不应超过此函数返回的值。
|
inlinenoexcept |
|
inlinenoexcept |
返回此构建器可用的 DLA 引擎数量。
|
inlinenoexcept |
获取构建器可以使用的本地插件注册表。
|
inlinenoexcept |
检查网络是否在 IBuilderConfig 设置的范围内。
network | 要检查配置合规性的网络定义。 |
config | 在检查 network 时要使用的构建器的配置。 |
给定一个 INetworkDefinition,network
,和一个 IBuilderConfig,config
,检查网络是否在基于 EngineCapability、BuilderFlag 和 DeviceType 的构建器配置约束范围内。 如果网络在约束范围内,则函数返回 true,如果发生违规,则返回 false。 此函数会将违反的条件报告给注册的 ErrorRecorder。
config.getProfileStream()
返回的 CUDA 流。
|
inlinenoexcept |
确定平台是否具有快速原生 fp16 支持。
|
inlinenoexcept |
确定平台是否具有快速原生 int8 支持。
|
inlinenoexcept |
确定平台是否具有 TF32 支持。
|
inlinenoexcept |
将构建器状态重置为默认值。
|
inlinenoexcept |
为此接口设置 ErrorRecorder。
将 ErrorRecorder 分配给此接口。 ErrorRecorder 将跟踪执行期间的所有错误。 此函数将至少调用一次已注册 ErrorRecorder 的 incRefCount。 将 recorder 设置为 nullptr 将取消注册接口的记录器,如果已注册记录器,则会导致调用 decRefCount。
如果未设置错误记录器,消息将发送到全局日志流。
recorder | 要向此接口注册的错误记录器。 |
|
inlinenoexcept |
设置 GPU 分配器。
allocator | 设置构建器要使用的 GPU 分配器。 所有获取的 GPU 内存都将使用此分配器。 如果传递 NULL,将使用默认分配器。 |
默认值:使用 cudaMalloc/cudaFree。
|
inlinenoexcept |
设置最大线程数。
maxThreads | 构建器可以使用的最大线程数。 |
默认值为 1,包括当前线程。 大于 1 的值允许 TensorRT 使用多线程算法。 小于 1 的值会触发 kINVALID_ARGUMENT 错误。
|
protected |
Copyright © 2024 NVIDIA Corporation
隐私政策 | 管理我的隐私 | 请勿出售或分享我的数据 | 服务条款 | 无障碍访问 | 公司政策 | 产品安全 | 联系我们