api/c_api/_nv_infer_runtime_plugin_8h_source.html

/*

 * SPDX-FileCopyrightText: 版权所有 (c) 1993-2024 NVIDIA CORPORATION & AFFILIATES。保留所有权利。

 * SPDX-License-Identifier: Apache-2.0

 *

 * 根据 Apache 许可证 2.0 版本（“许可证”）获得许可；

 * 除非遵守许可证，否则您不得使用此文件。

 * 您可以在以下位置获取许可证副本：

 *

 * https://apache.ac.cn/licenses/LICENSE-2.0

 *

 * 除非适用法律要求或书面同意，否则根据许可证

 * 分发的软件是按“现状”基础分发的，

 * 不附带任何形式的明示或暗示的保证或条件。

 * 有关管理权限和

 * 许可证限制的具体语言，请参阅许可证。

 */


#ifndef NV_INFER_RUNTIME_PLUGIN_H

#define NV_INFER_RUNTIME_PLUGIN_H


#define NV_INFER_INTERNAL_INCLUDE 1

#include "NvInferPluginBase.h"

#undef NV_INFER_INTERNAL_INCLUDE


namespace nvinfer1

{


enum class TensorFormat : int32_t;

namespace v_1_0

{

class IGpuAllocator;

}

using IGpuAllocator = v_1_0::IGpuAllocator;


using PluginFormat = TensorFormat;


static constexpr int32_t kPLUGIN_VERSION_PYTHON_BIT = 0x40;


struct PluginTensorDesc

{

 Dims dims;

 DataType type;

 TensorFormat format;

 float scale;

};


enum class PluginVersion : uint8_t

{

 kV2 = 0,

 kV2_EXT = 1,

 kV2_IOEXT = 2,

 kV2_DYNAMICEXT = 3,

 kV2_DYNAMICEXT_PYTHON = kPLUGIN_VERSION_PYTHON_BIT | 3

};


enum class PluginCreatorVersion : int32_t

{

 kV1 = 0,

 kV1_PYTHON = kPLUGIN_VERSION_PYTHON_BIT

};


class TRT_DEPRECATED IPluginV2

{

public

 virtual int32_t getTensorRTVersion() const noexcept

    {

 return NV_TENSORRT_VERSION;

    }


 virtual AsciiChar const* getPluginType() const noexcept = 0;


 virtual AsciiChar const* getPluginVersion() const noexcept = 0;


 virtual int32_t getNbOutputs() const noexcept = 0;


 virtual Dims getOutputDimensions(int32_t index, Dims const* inputs, int32_t nbInputDims) noexcept = 0;


 virtual bool supportsFormat(DataType type, PluginFormat format) const noexcept = 0;


 virtual void configureWithFormat(Dims const* inputDims, int32_t nbInputs, Dims const* outputDims, int32_t nbOutputs,

 DataType type, PluginFormat format, int32_t maxBatchSize) noexcept

        = 0;


 virtual int32_t initialize() noexcept = 0;


 virtual void terminate() noexcept = 0;


 virtual size_t getWorkspaceSize(int32_t maxBatchSize) const noexcept = 0;


 virtual int32_t enqueue(int32_t batchSize, void const* const* inputs, void* const* outputs, void* workspace,

 cudaStream_t stream) noexcept

        = 0;


 virtual size_t getSerializationSize() const noexcept = 0;


 virtual void serialize(void* buffer) const noexcept = 0;


 virtual void destroy() noexcept = 0;


 virtual IPluginV2* clone() const noexcept = 0;


 virtual void setPluginNamespace(AsciiChar const* pluginNamespace) noexcept = 0;


 virtual AsciiChar const* getPluginNamespace() const noexcept = 0;


 // @cond SuppressDoxyWarnings

 IPluginV2() = default;

 virtual ~IPluginV2() noexcept = default;

// @endcond


protected

// @cond SuppressDoxyWarnings

 IPluginV2(IPluginV2 const&) = default;

 IPluginV2(IPluginV2&&) = default;

 IPluginV2& operator=(IPluginV2 const&) & = default;

 IPluginV2& operator=(IPluginV2&&) & = default;

// @endcond

};


class TRT_DEPRECATED IPluginV2Ext : public IPluginV2

{

public

 virtual nvinfer1::DataType getOutputDataType(

 int32_t index, nvinfer1::DataType const* inputTypes, int32_t nbInputs) const noexcept

        = 0;


 TRT_DEPRECATED virtual bool isOutputBroadcastAcrossBatch(

 int32_t outputIndex, bool const* inputIsBroadcasted, int32_t nbInputs) const noexcept

        = 0;


 TRT_DEPRECATED virtual bool canBroadcastInputAcrossBatch(int32_t inputIndex) const noexcept = 0;


 virtual void configurePlugin(Dims const* inputDims, int32_t nbInputs, Dims const* outputDims, int32_t nbOutputs,

 DataType const* inputTypes, DataType const* outputTypes, bool const* inputIsBroadcast,

 bool const* outputIsBroadcast, PluginFormat floatFormat, int32_t maxBatchSize) noexcept

        = 0;


 IPluginV2Ext() = default;

 ~IPluginV2Ext() override = default;


 virtual void attachToContext(

 cudnnContext* /*cudnn*/, cublasContext* /*cublas*/, IGpuAllocator* /*allocator*/) noexcept

    {

    }


 virtual void detachFromContext() noexcept {}


 IPluginV2Ext* clone() const noexcept override = 0;


protected

 // @cond SuppressDoxyWarnings

 IPluginV2Ext(IPluginV2Ext const&) = default;

 IPluginV2Ext(IPluginV2Ext&&) = default;

 IPluginV2Ext& operator=(IPluginV2Ext const&) & = default;

 IPluginV2Ext& operator=(IPluginV2Ext&&) & = default;

// @endcond


 int32_t getTensorRTVersion() const noexcept override

    {

 return static_cast<int32_t>((static_cast<uint32_t>(PluginVersion::kV2_EXT) << 24U)

 | (static_cast<uint32_t>(NV_TENSORRT_VERSION) & 0xFFFFFFU));

    }


 void configureWithFormat(Dims const* /*inputDims*/, int32_t /*nbInputs*/, Dims const* /*outputDims*/,

 int32_t /*nbOutputs*/, DataType /*type*/, PluginFormat /*format*/, int32_t /*maxBatchSize*/) noexcept override

    {

    }

};


class TRT_DEPRECATED IPluginV2IOExt : public IPluginV2Ext

{

public

 virtual void configurePlugin(

 PluginTensorDesc const* in, int32_t nbInput, PluginTensorDesc const* out, int32_t nbOutput) noexcept

        = 0;


 virtual bool supportsFormatCombination(

 int32_t pos, PluginTensorDesc const* inOut, int32_t nbInputs, int32_t nbOutputs) const noexcept

        = 0;


 // @cond SuppressDoxyWarnings

 IPluginV2IOExt() = default;

 ~IPluginV2IOExt() override = default;

// @endcond


protected

// @cond SuppressDoxyWarnings

 IPluginV2IOExt(IPluginV2IOExt const&) = default;

 IPluginV2IOExt(IPluginV2IOExt&&) = default;

 IPluginV2IOExt& operator=(IPluginV2IOExt const&) & = default;

 IPluginV2IOExt& operator=(IPluginV2IOExt&&) & = default;

// @endcond


 int32_t getTensorRTVersion() const noexcept override

    {

 return static_cast<int32_t>((static_cast<uint32_t>(PluginVersion::kV2_IOEXT) << 24U)

 | (static_cast<uint32_t>(NV_TENSORRT_VERSION) & 0xFFFFFFU));

    }


private

 // 以下是过时的基类方法，不应实现或使用。


 void configurePlugin(Dims const*, int32_t, Dims const*, int32_t, DataType const*, DataType const*, bool const*,

 bool const*, PluginFormat, int32_t) noexcept final

    {

    }


 bool supportsFormat(DataType, PluginFormat) const noexcept final

    {

 return false;

    }

};


namespace v_1_0

{

class TRT_DEPRECATED IPluginCreator : public IPluginCreatorInterface

{

public

 virtual AsciiChar const* getPluginName() const noexcept = 0;


 virtual AsciiChar const* getPluginVersion() const noexcept = 0;


 virtual PluginFieldCollection const* getFieldNames() noexcept = 0;


 virtual IPluginV2* createPlugin(AsciiChar const* name, PluginFieldCollection const* fc) noexcept = 0;


 virtual IPluginV2* deserializePlugin(AsciiChar const* name, void const* serialData, size_t serialLength) noexcept

        = 0;


 virtual void setPluginNamespace(AsciiChar const* pluginNamespace) noexcept = 0;


 virtual AsciiChar const* getPluginNamespace() const noexcept = 0;


 IPluginCreator() = default;

 ~IPluginCreator() override = default;


protected

 // @cond SuppressDoxyWarnings

 IPluginCreator(IPluginCreator const&) = default;

 IPluginCreator(IPluginCreator&&) = default;

 IPluginCreator& operator=(IPluginCreator const&) & = default;

 IPluginCreator& operator=(IPluginCreator&&) & = default;

 // @endcond

public

 InterfaceInfo getInterfaceInfo() const noexcept override

    {

 return InterfaceInfo{"PLUGIN CREATOR_V1", 1, 0};

    }

};

} // namespace v_1_0


using IPluginCreator = v_1_0::IPluginCreator;


} // namespace nvinfer1


#endif // NV_INFER_RUNTIME_PLUGIN_H

NvInferPluginBase.h

NV_TENSORRT_VERSION
#define NV_TENSORRT_VERSION
定义: NvInferRuntimeBase.h:91

TRT_DEPRECATED
#define TRT_DEPRECATED
定义: NvInferRuntimeBase.h:45

IGpuAllocator
应用程序实现的类，用于控制 GPU 上的分配。

nvinfer1::Dims64
定义: NvInferRuntimeBase.h:203

nvinfer1::IPluginV2Ext
用户实现的层的插件类。
定义: NvInferRuntimePlugin.h:468

nvinfer1::IPluginV2Ext::canBroadcastInputAcrossBatch
virtual TRT_DEPRECATED bool canBroadcastInputAcrossBatch(int32_t inputIndex) const noexcept=0
如果插件可以使用跨批次广播而无需复制的输入张量，则返回 true。

nvinfer1::IPluginV2Ext::~IPluginV2Ext
~IPluginV2Ext() override=default

nvinfer1::IPluginV2Ext::configureWithFormat
void configureWithFormat(Dims const *, int32_t, Dims const *, int32_t, DataType, PluginFormat, int32_t) noexcept override
派生类不得实现此方法。在 C++11 API 中，这将是 override final。
定义: NvInferRuntimePlugin.h:698

nvinfer1::IPluginV2Ext::clone
IPluginV2Ext * clone() const noexcept override=0
克隆插件对象。这也会复制内部插件参数并返回一个新插件...

nvinfer1::IPluginV2Ext::configurePlugin
virtual void configurePlugin(Dims const *inputDims, int32_t nbInputs, Dims const *outputDims, int32_t nbOutputs, DataType const *inputTypes, DataType const *outputTypes, bool const *inputIsBroadcast, bool const *outputIsBroadcast, PluginFormat floatFormat, int32_t maxBatchSize) noexcept=0
使用输入和输出数据类型配置层。

nvinfer1::IPluginV2Ext::detachFromContext
virtual void detachFromContext() noexcept
将插件对象从其执行上下文中分离。
定义: NvInferRuntimePlugin.h:645

nvinfer1::IPluginV2Ext::isOutputBroadcastAcrossBatch
virtual TRT_DEPRECATED bool isOutputBroadcastAcrossBatch(int32_t outputIndex, bool const *inputIsBroadcasted, int32_t nbInputs) const noexcept=0
如果输出张量跨批次广播，则返回 true。

nvinfer1::IPluginV2Ext::attachToContext
virtual void attachToContext(cudnnContext *, cublasContext *, IGpuAllocator *) noexcept
将插件对象附加到执行上下文，并授予插件访问某些上下文资源的权限...
定义: NvInferRuntimePlugin.h:627

nvinfer1::IPluginV2Ext::IPluginV2Ext
IPluginV2Ext()=default

nvinfer1::IPluginV2Ext::getOutputDataType
virtual nvinfer1::DataType getOutputDataType(int32_t index, nvinfer1::DataType const *inputTypes, int32_t nbInputs) const noexcept=0
返回请求索引处插件输出的 DataType。

nvinfer1::IPluginV2
用户实现的层的插件类。
定义: NvInferRuntimePlugin.h:133

nvinfer1::IPluginV2::getPluginType
virtual AsciiChar const * getPluginType() const noexcept=0
返回插件类型。应与相应插件创建器返回的插件名称匹配。

nvinfer1::IPluginV2::getTensorRTVersion
virtual int32_t getTensorRTVersion() const noexcept
返回构建此插件的 API 版本。
定义: NvInferRuntimePlugin.h:147

nvinfer1::IPluginV2IOExt
用户实现的层的插件类。
定义: NvInferRuntimePlugin.h:717

nvinfer1::IPluginV2IOExt::getTensorRTVersion
int32_t getTensorRTVersion() const noexcept override
返回构建此插件的 API 版本。高位字节由 TensorRT 保留，并且...
定义: NvInferRuntimePlugin.h:805

nvinfer1::IPluginV2IOExt::configurePlugin
virtual void configurePlugin(PluginTensorDesc const *in, int32_t nbInput, PluginTensorDesc const *out, int32_t nbOutput) noexcept=0
配置层。

nvinfer1::IPluginV2IOExt::supportsFormatCombination
virtual bool supportsFormatCombination(int32_t pos, PluginTensorDesc const *inOut, int32_t nbInputs, int32_t nbOutputs) const noexcept=0
如果插件支持 pos 索引的输入/输出的格式和数据类型，则返回 true。

nvinfer1::InterfaceInfo
与 TRT 接口关联的版本信息。
定义: NvInferRuntimeBase.h:228

nvinfer1::v_1_0::IGpuAllocator
定义: NvInferRuntime.h:1608

nvinfer1::v_1_0::IPluginCreator
定义: NvInferRuntimePlugin.h:834

nvinfer1::v_1_0::IPluginCreator::getPluginName
virtual AsciiChar const * getPluginName() const noexcept=0
返回插件名称。

nvinfer1::v_1_0::IPluginCreatorInterface
定义: NvInferPluginBase.h:193

nvinfer1
TensorRT API 版本 1 的命名空间。

nvinfer1::PluginCreatorVersion
PluginCreatorVersion
用于标识插件创建器版本的枚举。
定义: NvInferRuntimePlugin.h:111

nvinfer1::PluginCreatorVersion::kV1
@ kV1
IPluginCreator.

nvinfer1::PluginCreatorVersion::kV1_PYTHON
@ kV1_PYTHON
基于 IPluginCreator 的 Python 插件创建器。

nvinfer1::IPluginCreator
v_1_0::IPluginCreator IPluginCreator
定义: NvInferRuntimePlugin.h:970

nvinfer1::IGpuAllocator
v_1_0::IGpuAllocator IGpuAllocator
定义: NvInferRuntime.h:1807

nvinfer1::AsciiChar
char_t AsciiChar
定义: NvInferRuntimeBase.h:105

nvinfer1::PluginVersion::kV2_DYNAMICEXT
@ kV2_DYNAMICEXT
IPluginV2DynamicExt.

nvinfer1::PluginVersion::kV2
@ kV2
IPluginV2.

nvinfer1::PluginVersion::kV2_IOEXT
@ kV2_IOEXT
IPluginV2IOExt.

nvinfer1::PluginVersion::kV2_EXT
@ kV2_EXT
IPluginV2Ext.

nvinfer1::PluginVersion::kV2_DYNAMICEXT_PYTHON
@ kV2_DYNAMICEXT_PYTHON
基于 IPluginV2DynamicExt 的 Python 插件。

nvinfer1::DataType
DataType
权重和张量的类型。
定义: NvInferRuntimeBase.h:133

nvinfer1::PluginFormat
TensorFormat PluginFormat
PluginFormat 保留用于向后兼容。
定义: NvInferRuntimePlugin.h:54

nvinfer1::TensorFormat
TensorFormat
输入/输出张量的格式。
定义: NvInferRuntime.h:1382

PluginVersion
插件版本的定义。

nvinfer1::PluginFieldCollection
插件字段集合结构体。
定义: NvInferPluginBase.h:103

nvinfer1::PluginTensorDesc
插件可能看到的输入或输出字段。
定义: NvInferRuntimePlugin.h:73

nvinfer1::PluginTensorDesc::type
DataType type
定义: NvInferRuntimePlugin.h:77

nvinfer1::PluginTensorDesc::dims
Dims dims
维度。
定义: NvInferRuntimePlugin.h:75

nvinfer1::PluginTensorDesc::format
TensorFormat format
张量格式。
定义: NvInferRuntimePlugin.h:79

nvinfer1::PluginTensorDesc::scale
float scale
INT8 数据类型的缩放比例。
定义: NvInferRuntimePlugin.h:81