nvidia.dali.fn#

下表列出了 nvidia.dali.fn 模块中所有可用的操作

函数	设备支持	简短描述
`audio_decoder`	CPU	`decoders.audio()` 的旧版别名。
`audio_resample`	CPU, GPU	重采样音频信号。
`batch_permutation`	CPU	生成一批随机整数，可以用作索引，用于索引批处理中的样本。
`bb_flip`	CPU, GPU	水平或垂直翻转（镜像）边界框。
`bbox_paste`	CPU	转换边界框，以便在将图像粘贴到更大的画布上后，框在图像中保持在相同的位置。
`box_encoder`	CPU, GPU	使用作为参数传递的一组默认框（锚点）对输入边界框和标签进行编码。
`brightness`	CPU, GPU	调整图像的亮度。
`brightness_contrast`	CPU, GPU	调整图像的亮度和对比度。
`caffe2_reader`	CPU	`readers.caffe2()` 的旧版别名。
`caffe_reader`	CPU	`readers.caffe()` 的旧版别名。
`cast`	CPU, GPU	将张量转换为不同的类型。
`cast_like`	CPU, GPU	将第一个张量转换为第二个张量的类型。
`cat`	CPU, GPU	沿着现有轴连接输入张量。
`coco_reader`	CPU	`readers.coco()` 的旧版别名。
`coin_flip`	CPU, GPU	生成遵循伯努利分布的随机布尔值。
`color_space_conversion`	CPU, GPU	在各种图像颜色模型之间进行转换。
`color_twist`	CPU, GPU	调整图像的色调、饱和度、亮度和对比度。
`contrast`	CPU, GPU	调整图像的对比度。
`coord_flip`	CPU, GPU	通过相对于给定中心翻转（反射）其坐标来变换向量或点。
`coord_transform`	CPU, GPU	对点或向量应用线性变换。
`copy`	CPU, GPU	创建输入张量的副本。
`crop`	CPU, GPU	使用指定的窗口尺寸和窗口位置（左上角）裁剪图像。
`crop_mirror_normalize`	CPU, GPU	执行融合裁剪、归一化、格式转换（NHWC 到 NCHW）（如果需要）和类型转换。
`dl_tensor_python_function`	CPU, GPU	执行对 DLPack 张量进行操作的 Python 函数。
`dump_image`	CPU, GPU	将批量图像以 PPM 格式保存到磁盘。
`element_extract`	CPU, GPU	从输入序列中提取一个或多个元素。
`erase`	CPU, GPU	从输入张量中擦除一个或多个区域。
`expand_dims`	CPU, GPU	插入维度为 1 的新维度到数据形状中。
`external_source`	CPU, GPU	允许将外部提供的数据作为 pipeline 的输入传递。
`fast_resize_crop_mirror`	CPU, GPU	ResizedCropMirror 的旧版别名，默认情况下禁用抗锯齿。
`file_reader`	CPU	`readers.file()` 的旧版别名。
`flip`	CPU, GPU	在选定的维度（水平、垂直和深度方向）中翻转图像。
`full`	CPU	返回具有给定形状和类型的新数据，并用填充值填充。
`full_like`	CPU	返回与输入数据具有相同形状和类型的新数据，并用 fill_value 填充。
`gaussian_blur`	CPU, GPU	对输入应用高斯模糊。
`get_property`	CPU, GPU	返回作为输入传递的张量的属性。
`grid_mask`	CPU, GPU	执行 gridmask 增强 (https://arxiv.org/abs/2001.04086)。
`hsv`	CPU, GPU	调整图像的色调、饱和度和值（亮度）。
`hue`	CPU, GPU	更改图像的色调级别。
`image_decoder`	CPU, 混合	`decoders.image()` 的旧版别名。
`image_decoder_crop`	CPU, 混合	`decoders.image_crop()` 的旧版别名。
`image_decoder_random_crop`	CPU, 混合	`decoders.image_random_crop()` 的旧版别名。
`image_decoder_slice`	CPU, 混合	`decoders.image_slice()` 的旧版别名。
`jitter`	GPU	执行随机 Jitter 增强。
`jpeg_compression_distortion`	CPU, GPU	向 RGB 图像引入 JPEG 压缩伪影。
`laplacian`	CPU, GPU	计算输入的拉普拉斯算子。
`lookup_table`	CPU, GPU	通过使用由 keys 和 values 指定的查找表以及未指定键的 default_value 将输入映射到输出。
`mel_filter_bank`	CPU, GPU	通过应用三角形滤波器组将频谱图转换为梅尔频谱图。
`mfcc`	CPU, GPU	从梅尔频谱图计算梅尔频率倒谱系数 (MFCC)。
`multi_paste`	CPU, GPU	对每个输出执行来自图像批处理的多次粘贴。
`mxnet_reader`	CPU	`readers.mxnet()` 的旧版别名。
`nemo_asr_reader`	CPU	`readers.nemo_asr()` 的旧版别名。
`nonsilent_region`	CPU, GPU	在音频缓冲区中执行前导和尾随静音检测。
`normal_distribution`	CPU, GPU	生成遵循正态分布的随机数。
`normalize`	CPU, GPU	通过移除均值并除以标准差来归一化输入。
`numba_function`	CPU, GPU	调用 njit 编译的 Numba 函数。
`numpy_reader`	CPU, GPU	`readers.numpy()` 的旧版别名。
`one_hot`	CPU, GPU	生成输入的 one-hot 编码。
`ones`	CPU	返回具有给定形状和类型的新数据，并用 1 填充。
`ones_like`	CPU	返回与输入数组具有相同形状和类型的新数据，并用 1 填充。
`optical_flow`	GPU	计算输入中图像之间的光流。
`pad`	CPU, GPU	在指定的轴中用 fill_value 填充所有样本，以匹配这些轴中批处理中的最大范围或匹配指定的最小形状。
`paste`	GPU	将输入图像粘贴到更大的画布上，其中画布大小等于 `输入大小 * 比例`。
`peek_image_shape`	CPU	获取编码图像的形状。
`per_frame`	CPU, GPU	将输入张量标记为序列。
`permute_batch`	CPU, GPU	返回通过根据 indices 参数中给出的索引从输入中选择张量而构造的张量批次。
`power_spectrum`	CPU	计算信号的功率谱。
`preemphasis_filter`	CPU, GPU	对输入数据应用预加重滤波器。
`python_function`	CPU, GPU	执行 Python 函数。
`random_bbox_crop`	CPU	对图像坐标空间应用前瞻性随机裁剪，同时保持边界框，并可选择保持标签一致。
`random_crop_generator`	CPU	生成具有随机选择的面积和纵横比的裁剪窗口。
`random_resized_crop`	CPU, GPU	执行具有随机选择的面积和纵横比的裁剪，并将其调整为指定的大小。
`reinterpret`	CPU, GPU	将输入的内容视为具有不同的类型、形状和/或布局。
`reshape`	CPU, GPU	将输入的内容视为具有不同的形状和/或布局。
`resize`	CPU, GPU	调整图像大小。
`resize_crop_mirror`	CPU, GPU	执行融合调整大小、裁剪、镜像操作。
`roi_random_crop`	CPU	生成固定形状的裁剪窗口，随机放置，以便尽可能多地包含提供的感兴趣区域 (ROI)。
`rotate`	CPU, GPU	将图像旋转指定的角度。
`saturation`	CPU, GPU	更改图像的饱和度级别。
`sequence_reader`	CPU	`readers.sequence()` 的旧版别名。
`sequence_rearrange`	CPU, GPU	重新排列序列中的帧。
`shapes`	CPU, GPU	返回输入批次中张量的形状。
`slice`	CPU, GPU	提取子张量或切片。
`spectrogram`	CPU, GPU	从一维信号（例如，音频）生成频谱图。
`sphere`	CPU, GPU	执行球体增强。
`squeeze`	CPU, GPU	移除作为 axes 或 axis_names 给出的维度。
`ssd_random_crop`	CPU	执行带有边界框的随机裁剪，其中 Intersection Over Union (IoU) 满足 0-1 之间随机选择的阈值。
`stack`	CPU, GPU	沿着新轴连接输入张量。
`tfrecord_reader`	CPU	`readers.tfrecord()` 的旧版别名。
`to_decibels`	CPU, GPU	将幅度（实数，正数）转换为分贝刻度。
`torch_python_function`	CPU, GPU	执行对 Torch 张量进行操作的函数。
`transpose`	CPU, GPU	通过基于 perm 参数重新排序维度来转置张量。
`uniform`	CPU, GPU	生成遵循均匀分布的随机数。
`video_reader`	GPU	`readers.video()` 的旧版别名。
`video_reader_resize`	GPU	`readers.video_resize()` 的旧版别名。
`warp_affine`	CPU, GPU	对图像应用仿射变换。
`water`	CPU, GPU	执行水增强，使图像看起来像在水下。
`zeros`	CPU	返回具有给定形状和类型的新数据，并用零填充。
`zeros_like`	CPU	返回与输入数组具有相同形状和类型的新数据，并用零填充。