nvidia.dali.fn.decoders.image_random_crop#
- nvidia.dali.fn.decoders.image_random_crop(__input, /, *, affine=True, bytes_per_sample_hint=[0], device_memory_padding=16777216, device_memory_padding_jpeg2k=0, host_memory_padding=8388608, host_memory_padding_jpeg2k=0, hw_decoder_load=0.65, hybrid_huffman_threshold=1000000, jpeg_fancy_upsampling=False, memory_stats=False, num_attempts=10, output_type=DALIImageType.RGB, preallocate_height_hint=0, preallocate_width_hint=0, preserve=False, random_area=[0.08, 1.0], random_aspect_ratio=[0.75, 1.333333], seed=-1, use_fast_idct=False, device=None, name=None)#
解码图像并随机裁剪它们。
裁剪窗口的面积(相对于整个图像)和宽高比可以限制为由
area
和 aspect_ratio 参数分别指定的值范围。在可能的情况下,运算符使用 ROI 解码 API(例如,libjpeg-turbo 和 nvJPEG)来减少解码时间和内存使用量。当给定图像格式不支持 ROI 解码时,它将解码整个图像并裁剪选定的 ROI。
解码器的输出采用 HWC 布局。
支持的格式:JPG、BMP、PNG、TIFF、PNM、PPM、PGM、PBM、JPEG 2000、WebP。
注意
JPEG 2000 感兴趣区域 (ROI) 解码在 GPU 上未加速,并且将使用 CPU 实现,而与选择的后端无关。对于 GPU 加速实现,请考虑使用单独的
decoders.image
和random_crop
运算符。注意
EXIF 方向元数据被忽略。
- 支持的后端
‘cpu’
‘mixed’
- 参数:
__input¶ (TensorList) – 运算符的输入。
- 关键字参数:
affine¶ (bool, optional, default = True) –
仅适用于
mixed
后端类型。如果设置为 True,则内部线程池中的每个线程将绑定到特定的 CPU 核心。否则,操作系统可以将线程重新分配给任何 CPU 核心。
bytes_per_sample_hint¶ (int or list of int, optional, default = [0]) –
每个样本的输出大小提示(以字节为单位)。
如果指定,则将预先分配驻留在 GPU 或分页锁定主机内存中的运算符输出,以容纳此大小的样本批次。
device_memory_padding¶ (int, optional, default = 16777216) –
仅适用于
mixed
后端类型。nvJPEG 设备内存分配的填充(以字节为单位)。此参数有助于避免在遇到较大的图像时重新分配 nvJPEG,并且需要重新分配内部缓冲区以解码图像。
如果提供的值大于 0,则运算符会为每个线程预先分配一个请求大小的设备缓冲区。如果正确选择该值,则在 pipeline 执行期间不会发生额外的分配。找到理想值的一种方法是在数据集上完成完整运行,并将
memory_stats
参数设置为 True,然后复制统计信息中打印的最大分配值。device_memory_padding_jpeg2k¶ (int, optional, default = 0) –
仅适用于
mixed
后端类型。nvJPEG2k 设备内存分配的填充(以字节为单位)。此参数有助于避免在遇到较大的图像时重新分配 nvJPEG2k,并且需要重新分配内部缓冲区以解码图像。
如果提供的值大于 0,则运算符会根据提供的提示预先分配必要数量的缓冲区。如果正确选择该值,则在 pipeline 执行期间不会发生额外的分配。找到理想值的一种方法是在数据集上完成完整运行,并将
memory_stats
参数设置为 True,然后复制统计信息中打印的最大分配值。host_memory_padding¶ (int, optional, default = 8388608) –
仅适用于
mixed
后端类型。nvJPEG 主机内存分配的填充(以字节为单位)。此参数有助于防止在遇到较大的图像时重新分配 nvJPEG,并且需要重新分配内部缓冲区以解码图像。
如果提供的值大于 0,则运算符会为每个线程预先分配两个(由于双缓冲)请求大小的主机固定缓冲区。如果选择正确,则在 pipeline 执行期间不会发生额外的分配。找到理想值的一种方法是在数据集上完成完整运行,并将
memory_stats
参数设置为 True,然后复制统计信息中打印的最大分配值。host_memory_padding_jpeg2k¶ (int, optional, default = 0) –
仅适用于
mixed
后端类型。nvJPEG2k 主机内存分配的填充(以字节为单位)。此参数有助于防止在遇到较大的图像时重新分配 nvJPEG2k,并且需要重新分配内部缓冲区以解码图像。
如果提供的值大于 0,则运算符会根据提供的提示预先分配必要数量的缓冲区。如果正确选择该值,则在 pipeline 执行期间不会发生额外的分配。找到理想值的一种方法是在数据集上完成完整运行,并将
memory_stats
参数设置为 True,然后复制统计信息中打印的最大分配值。hw_decoder_load¶ (float, optional, default = 0.65) –
由硬件 JPEG 解码器处理的图像数据百分比。
仅适用于 NVIDIA Ampere GPU 及更高架构中的
mixed
后端类型。确定将卸载到硬件解码器(如果可用)的工作负载的百分比。最佳工作负载取决于提供给 DALI pipeline 的线程数,应通过经验找到。更多详细信息,请访问 https://developer.nvidia.com/blog/loading-data-fast-with-dali-and-new-jpeg-decoder-in-a100
hybrid_huffman_threshold¶ (int, optional, default = 1000000) –
仅适用于
mixed
后端类型。像素总数(
height * width
)高于此阈值的图像将使用 nvJPEG 混合 Huffman 解码器。像素较少的图像将使用 nvJPEG 主机端 Huffman 解码器。注意
混合 Huffman 解码器仍然在很大程度上使用 CPU。
jpeg_fancy_upsampling¶ (bool, optional, default = False) –
使
mixed
后端使用与cpu
后端相同的色度上采样方法。此选项对应于 libjpegturbo 或 ImageMagick 中提供的 JPEG 精细上采样。
memory_stats¶ (bool, optional, default = False) –
仅适用于
mixed
后端类型。打印有关 nvJPEG 分配的调试信息。有关最大分配的信息可能有助于确定数据集的
device_memory_padding
和host_memory_padding
的合适值。注意
统计信息是针对整个过程全局的,而不是每个运算符实例,并且包括在构造期间进行的分配(如果填充提示为非零)。
num_attempts¶ (int, optional, default = 10) – 用于选择随机面积和宽高比的最大尝试次数。
output_type¶ (
nvidia.dali.types.DALIImageType
, optional, default = DALIImageType.RGB) –输出图像的色彩空间。
注意:当解码为 YCbCr 时,图像将解码为 RGB,然后转换为 YCbCr,遵循 ITU-R BT.601 中的 YCbCr 定义。
preallocate_height_hint¶ (int, optional, default = 0) –
图像宽度提示。
仅适用于 NVIDIA Ampere GPU 及更高架构中的
mixed
后端类型。该提示用于为 HW JPEG 解码器预先分配内存。
preallocate_width_hint¶ (int, optional, default = 0) –
图像宽度提示。
仅适用于 NVIDIA Ampere GPU 及更高架构中的
mixed
后端类型。该提示用于为 HW JPEG 解码器预先分配内存。
preserve¶ (bool, optional, default = False) – 阻止运算符从图中删除,即使其输出未使用。
random_area¶ (float or list of float, optional, default = [0.08, 1.0]) –
从中选择随机面积分数
A
的范围。裁剪图像的面积将等于
A
* 原始图像的面积。random_aspect_ratio¶ (float or list of float, optional, default = [0.75, 1.333333]) – 从中选择随机宽高比(宽度/高度)的范围。
seed¶ (int, optional, default = -1) – 随机种子;如果未设置,将自动分配一个。
split_stages¶ (bool) –
警告
参数 split_stages 不再使用,将在未来的版本中删除。
use_chunk_allocator¶ (bool) –
警告
参数 use_chunk_allocator 不再使用,将在未来的版本中删除。
use_fast_idct¶ (bool, optional, default = False) –
在基于 libjpeg-turbo 的 CPU 解码器中启用快速 IDCT,当
device
设置为 “cpu” 时,或者当它设置为 “mixed” 但特定图像无法由 GPU 实现处理时使用。根据 libjpeg-turbo 文档,解压缩性能最多可提高 14%,而质量几乎没有降低。
另请参阅