PyNvVideoCodec API 编程指南

概述

NVIDIA 的视频编解码器 SDK 通过高度优化的 C/C++ API 提供硬件加速的视频编码和解码。这种视频的编码和解码对于包括计算机视觉专家、研究人员和深度学习 (DL) 开发者在内的广泛用户也很有用。PyNvVideoCodec 的目标是为在 Python 中处理视频时利用此类视频编码和解码能力提供简单的 API。

PyNvVideoCodec 提供的编码和解码性能（FPS）接近视频编解码器 SDK。

PyNvVideoCodec 是一个库，它为硬件加速视频编码和解码的 C++ API 提供 Python 绑定。在内部，它利用 NVIDIA 视频编解码器 SDK 的核心 API，并提供 Python 固有的易用性。它依赖外部 FFmpeg 库进行媒体文件解复用。以下是显示客户端应用程序、PyNvVideoCodec 库和相关组件的高级框图。

图 1. 高级架构图

表 1. `CreateEncoder` 的可选参数
参数	类型	有效值	默认参数	描述
`codec`	String	`h264`, `hevc`, `av1`	`h264`
`bitrate`	Integer	> 0	10000000U
`fps`	Integer	> 0	30	要编码的视频的所需帧率（FPS），默认值设置为 30
`initqp`	Integer	> 0	未设置选项	初始量化参数 (QP)
`idrperiod`	Integer	> 0	250	Instantaneous Decoder Refresh (IDR) 帧之间的周期
`constqp`	Integer 或 3 个整数的列表	>=0, <=51
`qmin`	Integer 或 3 个整数的列表	>=0, <=51	[30,30,30]
`gop`	Integer 或 3 个整数的列表	>0	根据其他设置而变化
`tuning_info`	String	`high_quality`, `low_latency`, `ultra_low_latency`, `lossless`	`high_quality`
`preset`	String	`P1` 到 `P7`	`P4`
`maxbitrate`	Integer	>0	10000000U	用于可变比特率 (VBR) 编码的最大比特率，允许根据视频内容动态调整比特率
`vbvinit`	Integer	>0	10000000U
`vbvbufsize`	Integer	>0	10000000U	目标客户端视频缓冲验证器 (VBV) 缓冲区大小，适用于 `vbr`。
`rc`	String	`cbr`, `constqp`, `vbr`	`cbr`	在恒定比特率 (CBR)、恒定 QP 或可变比特率 (VBR) 之间选择的速率控制 (RC) 类型
`multipass`	String	`fullres`, `qres`	`默认禁用`
`bf`	Integer	>=0	根据 `tuning_info` 和 `preset` 而变化	指定 GOP 模式，如下所示：`bf` = 0: I, 1: IPP, 2: IBP, 3: IBBP
`max_res`	2 个整数的列表	>0	H264 为 4K，HEVC, AV1 为 8K	分辨率不大于硬件支持的最大分辨率，以便考虑动态分辨率更改。例如：[3840, 2160]
`temporalaq`	Integer	0 或 1	0
`lookahead`	Integer	>0	0 到 255	要前瞻的帧数。
`aq`	Integer	0 或 1	0
`ldkfs`	Integer	>=0, <255	0	低延迟关键帧缩放对于避免在 `I` 帧最终生成大量比特时出现通道拥塞非常有用
`colorspace`	String	bt601, bt709		为 ARGB/ABGR 输入指定此选项
`timingInfo :: num_unit_in_ticks`	Integer	>0		指定时钟的时间单位数（如 ITU-T 规范附件 E 中定义）。仅限 HEVC 和 H264
`timingInfo :: timescale`	Integer	>0		指定时钟的频率（如 ITU-T 规范附件 E 中定义）。仅限 HEVC 和 H264
`slice::mode`	Integer	0 到 3	0	H.264 和 HEVC 编码的切片模式（AV1 不可用），可以是 0（基于 MB 的切片）、2（基于 MB 行的切片）或 3（切片数）
`slice::data`	Integer	有效范围根据 `slice::mode` 而变化	0	指定 `sliceMode` 所需的参数。AV1 不支持 `slice::data`
`repeatspspps`	Integer	0 或 1	0	为每个 IDR 帧启用写入 `Sequence Parameter Set` (SPS) 和 `Picture Parameter Set` (PPS)

本文档仅供参考，不得视为对产品的特定功能、条件或质量的保证。NVIDIA Corporation（“NVIDIA”）对本文档中包含的信息的准确性或完整性不作任何明示或暗示的陈述或保证，并且对本文档中包含的任何错误不承担任何责任。NVIDIA 对因使用此类信息或因使用此类信息而可能导致的侵犯第三方专利或其他权利的行为的后果或使用不承担任何责任。本文档不构成开发、发布或交付任何材料（如下定义）、代码或功能的承诺。

NVIDIA 保留随时更正、修改、增强、改进和对本文档进行任何其他更改的权利，恕不另行通知。

客户应在下订单前获取最新的相关信息，并应验证此类信息是否为最新且完整。

NVIDIA 产品的销售受 NVIDIA 在订单确认时提供的标准销售条款和条件的约束，除非 NVIDIA 和客户的授权代表签署的个人销售协议另有约定（“销售条款”）。NVIDIA 特此明确反对将任何客户通用条款和条件应用于购买本文档中引用的 NVIDIA 产品。本文档未直接或间接形成任何合同义务。

NVIDIA 产品并非设计、授权或保证适用于医疗、军事、飞机、航天或生命支持设备，也不适用于 NVIDIA 产品的故障或故障可能合理预期会导致人身伤害、死亡、财产或环境损害的应用。NVIDIA 对在此类设备或应用中包含和/或使用 NVIDIA 产品不承担任何责任，因此此类包含和/或使用由客户自行承担风险。

NVIDIA 不保证或声明基于本文档的产品将适用于任何特定用途。NVIDIA 不一定对每个产品的所有参数进行测试。客户全权负责评估和确定本文档中包含的任何信息的适用性，确保产品适用于客户计划的应用并适合该应用，并为该应用执行必要的测试，以避免应用或产品的默认设置。客户产品设计中的缺陷可能会影响 NVIDIA 产品的质量和可靠性，并可能导致超出本文档中包含的附加或不同条件和/或要求。NVIDIA 对可能基于或归因于以下原因的任何默认、损坏、成本或问题不承担任何责任：（i）以任何违反本文档的方式使用 NVIDIA 产品；或（ii）客户产品设计。

商标

NVIDIA、NVIDIA 徽标以及 cuBLAS、CUDA、CUDA Toolkit、cuDNN、DALI、DIGITS、DGX、DGX-1、DGX-2、DGX Station、DLProf、GPU、Jetson、Kepler、Maxwell、NCCL、Nsight Compute、Nsight Systems、NVCaffe、NVIDIA Deep Learning SDK、NVIDIA Developer Program、NVIDIA GPU Cloud、NVLink、NVSHMEM、PerfWorks、Pascal、SDK Manager、Tegra、TensorRT、TensorRT Inference Server、Tesla、TF-TRT、Triton Inference Server、Turing 和 Volta 是 NVIDIA Corporation 在美国和其他国家/地区的商标和/或注册商标。其他公司和产品名称可能是与其相关的各自公司的商标。

PyNvVideoCodec API 编程指南

概述

使用 PyNvVideoCodec API

视频解复用

解复用 API

解复用 API 用法

`PacketData`

视频解码

解码 API

视频解码详细信息

视频编码

编码 API

视频编码基础知识

表面格式支持

调优

预设

速率控制和比特率

构建优化的编码器

视频编码参数详细信息

与 DL/ML 框架的互操作性

声明

声明

商标