nvidia.dali.fn#

下表列出了 nvidia.dali.fn 模块中所有可用的操作

函数

设备支持

简短描述

audio_decoder

CPU

decoders.audio() 的旧版别名。

audio_resample

CPU, GPU

重采样音频信号。

batch_permutation

CPU

生成一批随机整数,可以用作索引,用于索引批处理中的样本。

bb_flip

CPU, GPU

水平或垂直翻转(镜像)边界框。

bbox_paste

CPU

转换边界框,以便在将图像粘贴到更大的画布上后,框在图像中保持在相同的位置。

box_encoder

CPU, GPU

使用作为参数传递的一组默认框(锚点)对输入边界框和标签进行编码。

brightness

CPU, GPU

调整图像的亮度。

brightness_contrast

CPU, GPU

调整图像的亮度和对比度。

caffe2_reader

CPU

readers.caffe2() 的旧版别名。

caffe_reader

CPU

readers.caffe() 的旧版别名。

cast

CPU, GPU

将张量转换为不同的类型。

cast_like

CPU, GPU

将第一个张量转换为第二个张量的类型。

cat

CPU, GPU

沿着现有轴连接输入张量。

coco_reader

CPU

readers.coco() 的旧版别名。

coin_flip

CPU, GPU

生成遵循伯努利分布的随机布尔值。

color_space_conversion

CPU, GPU

在各种图像颜色模型之间进行转换。

color_twist

CPU, GPU

调整图像的色调、饱和度、亮度和对比度。

contrast

CPU, GPU

调整图像的对比度。

coord_flip

CPU, GPU

通过相对于给定中心翻转(反射)其坐标来变换向量或点。

coord_transform

CPU, GPU

对点或向量应用线性变换。

copy

CPU, GPU

创建输入张量的副本。

crop

CPU, GPU

使用指定的窗口尺寸和窗口位置(左上角)裁剪图像。

crop_mirror_normalize

CPU, GPU

执行融合裁剪、归一化、格式转换(NHWC 到 NCHW)(如果需要)和类型转换。

dl_tensor_python_function

CPU, GPU

执行对 DLPack 张量进行操作的 Python 函数。

dump_image

CPU, GPU

将批量图像以 PPM 格式保存到磁盘。

element_extract

CPU, GPU

从输入序列中提取一个或多个元素。

erase

CPU, GPU

从输入张量中擦除一个或多个区域。

expand_dims

CPU, GPU

插入维度为 1 的新维度到数据形状中。

external_source

CPU, GPU

允许将外部提供的数据作为 pipeline 的输入传递。

fast_resize_crop_mirror

CPU, GPU

ResizedCropMirror 的旧版别名,默认情况下禁用抗锯齿。

file_reader

CPU

readers.file() 的旧版别名。

flip

CPU, GPU

在选定的维度(水平、垂直和深度方向)中翻转图像。

full

CPU

返回具有给定形状和类型的新数据,并用填充值填充。

full_like

CPU

返回与输入数据具有相同形状和类型的新数据,并用 fill_value 填充。

gaussian_blur

CPU, GPU

对输入应用高斯模糊。

get_property

CPU, GPU

返回作为输入传递的张量的属性。

grid_mask

CPU, GPU

执行 gridmask 增强 (https://arxiv.org/abs/2001.04086)。

hsv

CPU, GPU

调整图像的色调、饱和度和值(亮度)。

hue

CPU, GPU

更改图像的色调级别。

image_decoder

CPU, 混合

decoders.image() 的旧版别名。

image_decoder_crop

CPU, 混合

decoders.image_crop() 的旧版别名。

image_decoder_random_crop

CPU, 混合

decoders.image_random_crop() 的旧版别名。

image_decoder_slice

CPU, 混合

decoders.image_slice() 的旧版别名。

jitter

GPU

执行随机 Jitter 增强。

jpeg_compression_distortion

CPU, GPU

向 RGB 图像引入 JPEG 压缩伪影。

laplacian

CPU, GPU

计算输入的拉普拉斯算子。

lookup_table

CPU, GPU

通过使用由 keysvalues 指定的查找表以及未指定键的 default_value 将输入映射到输出。

mel_filter_bank

CPU, GPU

通过应用三角形滤波器组将频谱图转换为梅尔频谱图。

mfcc

CPU, GPU

从梅尔频谱图计算梅尔频率倒谱系数 (MFCC)。

multi_paste

CPU, GPU

对每个输出执行来自图像批处理的多次粘贴。

mxnet_reader

CPU

readers.mxnet() 的旧版别名。

nemo_asr_reader

CPU

readers.nemo_asr() 的旧版别名。

nonsilent_region

CPU, GPU

在音频缓冲区中执行前导和尾随静音检测。

normal_distribution

CPU, GPU

生成遵循正态分布的随机数。

normalize

CPU, GPU

通过移除均值并除以标准差来归一化输入。

numba_function

CPU, GPU

调用 njit 编译的 Numba 函数。

numpy_reader

CPU, GPU

readers.numpy() 的旧版别名。

one_hot

CPU, GPU

生成输入的 one-hot 编码。

ones

CPU

返回具有给定形状和类型的新数据,并用 1 填充。

ones_like

CPU

返回与输入数组具有相同形状和类型的新数据,并用 1 填充。

optical_flow

GPU

计算输入中图像之间的光流。

pad

CPU, GPU

在指定的轴中用 fill_value 填充所有样本,以匹配这些轴中批处理中的最大范围或匹配指定的最小形状。

paste

GPU

将输入图像粘贴到更大的画布上,其中画布大小等于 输入大小 * 比例

peek_image_shape

CPU

获取编码图像的形状。

per_frame

CPU, GPU

将输入张量标记为序列。

permute_batch

CPU, GPU

返回通过根据 indices 参数中给出的索引从输入中选择张量而构造的张量批次。

power_spectrum

CPU

计算信号的功率谱。

preemphasis_filter

CPU, GPU

对输入数据应用预加重滤波器。

python_function

CPU, GPU

执行 Python 函数。

random_bbox_crop

CPU

对图像坐标空间应用前瞻性随机裁剪,同时保持边界框,并可选择保持标签一致。

random_crop_generator

CPU

生成具有随机选择的面积和纵横比的裁剪窗口。

random_resized_crop

CPU, GPU

执行具有随机选择的面积和纵横比的裁剪,并将其调整为指定的大小。

reinterpret

CPU, GPU

将输入的内容视为具有不同的类型、形状和/或布局。

reshape

CPU, GPU

将输入的内容视为具有不同的形状和/或布局。

resize

CPU, GPU

调整图像大小。

resize_crop_mirror

CPU, GPU

执行融合调整大小、裁剪、镜像操作。

roi_random_crop

CPU

生成固定形状的裁剪窗口,随机放置,以便尽可能多地包含提供的感兴趣区域 (ROI)。

rotate

CPU, GPU

将图像旋转指定的角度。

saturation

CPU, GPU

更改图像的饱和度级别。

sequence_reader

CPU

readers.sequence() 的旧版别名。

sequence_rearrange

CPU, GPU

重新排列序列中的帧。

shapes

CPU, GPU

返回输入批次中张量的形状。

slice

CPU, GPU

提取子张量或切片。

spectrogram

CPU, GPU

从一维信号(例如,音频)生成频谱图。

sphere

CPU, GPU

执行球体增强。

squeeze

CPU, GPU

移除作为 axesaxis_names 给出的维度。

ssd_random_crop

CPU

执行带有边界框的随机裁剪,其中 Intersection Over Union (IoU) 满足 0-1 之间随机选择的阈值。

stack

CPU, GPU

沿着新轴连接输入张量。

tfrecord_reader

CPU

readers.tfrecord() 的旧版别名。

to_decibels

CPU, GPU

将幅度(实数,正数)转换为分贝刻度。

torch_python_function

CPU, GPU

执行对 Torch 张量进行操作的函数。

transpose

CPU, GPU

通过基于 perm 参数重新排序维度来转置张量。

uniform

CPU, GPU

生成遵循均匀分布的随机数。

video_reader

GPU

readers.video() 的旧版别名。

video_reader_resize

GPU

readers.video_resize() 的旧版别名。

warp_affine

CPU, GPU

对图像应用仿射变换。

water

CPU, GPU

执行水增强,使图像看起来像在水下。

zeros

CPU

返回具有给定形状和类型的新数据,并用零填充。

zeros_like

CPU

返回与输入数组具有相同形状和类型的新数据,并用零填充。