nvidia.dali.fn#
下表列出了 nvidia.dali.fn
模块中所有可用的操作
函数 |
设备支持 |
简短描述 |
---|---|---|
CPU |
|
|
CPU, GPU |
重采样音频信号。 |
|
CPU |
生成一批随机整数,可以用作索引,用于索引批处理中的样本。 |
|
CPU, GPU |
水平或垂直翻转(镜像)边界框。 |
|
CPU |
转换边界框,以便在将图像粘贴到更大的画布上后,框在图像中保持在相同的位置。 |
|
CPU, GPU |
使用作为参数传递的一组默认框(锚点)对输入边界框和标签进行编码。 |
|
CPU, GPU |
调整图像的亮度。 |
|
CPU, GPU |
调整图像的亮度和对比度。 |
|
CPU |
|
|
CPU |
|
|
CPU, GPU |
将张量转换为不同的类型。 |
|
CPU, GPU |
将第一个张量转换为第二个张量的类型。 |
|
CPU, GPU |
沿着现有轴连接输入张量。 |
|
CPU |
|
|
CPU, GPU |
生成遵循伯努利分布的随机布尔值。 |
|
CPU, GPU |
在各种图像颜色模型之间进行转换。 |
|
CPU, GPU |
调整图像的色调、饱和度、亮度和对比度。 |
|
CPU, GPU |
调整图像的对比度。 |
|
CPU, GPU |
通过相对于给定中心翻转(反射)其坐标来变换向量或点。 |
|
CPU, GPU |
对点或向量应用线性变换。 |
|
CPU, GPU |
创建输入张量的副本。 |
|
CPU, GPU |
使用指定的窗口尺寸和窗口位置(左上角)裁剪图像。 |
|
CPU, GPU |
执行融合裁剪、归一化、格式转换(NHWC 到 NCHW)(如果需要)和类型转换。 |
|
CPU, GPU |
执行对 DLPack 张量进行操作的 Python 函数。 |
|
CPU, GPU |
将批量图像以 PPM 格式保存到磁盘。 |
|
CPU, GPU |
从输入序列中提取一个或多个元素。 |
|
CPU, GPU |
从输入张量中擦除一个或多个区域。 |
|
CPU, GPU |
插入维度为 1 的新维度到数据形状中。 |
|
CPU, GPU |
允许将外部提供的数据作为 pipeline 的输入传递。 |
|
CPU, GPU |
ResizedCropMirror 的旧版别名,默认情况下禁用抗锯齿。 |
|
CPU |
|
|
CPU, GPU |
在选定的维度(水平、垂直和深度方向)中翻转图像。 |
|
CPU |
返回具有给定形状和类型的新数据,并用填充值填充。 |
|
CPU |
返回与输入数据具有相同形状和类型的新数据,并用 fill_value 填充。 |
|
CPU, GPU |
对输入应用高斯模糊。 |
|
CPU, GPU |
返回作为输入传递的张量的属性。 |
|
CPU, GPU |
执行 gridmask 增强 (https://arxiv.org/abs/2001.04086)。 |
|
CPU, GPU |
调整图像的色调、饱和度和值(亮度)。 |
|
CPU, GPU |
更改图像的色调级别。 |
|
CPU, 混合 |
|
|
CPU, 混合 |
|
|
CPU, 混合 |
|
|
CPU, 混合 |
|
|
GPU |
执行随机 Jitter 增强。 |
|
CPU, GPU |
向 RGB 图像引入 JPEG 压缩伪影。 |
|
CPU, GPU |
计算输入的拉普拉斯算子。 |
|
CPU, GPU |
通过使用由 keys 和 values 指定的查找表以及未指定键的 default_value 将输入映射到输出。 |
|
CPU, GPU |
通过应用三角形滤波器组将频谱图转换为梅尔频谱图。 |
|
CPU, GPU |
从梅尔频谱图计算梅尔频率倒谱系数 (MFCC)。 |
|
CPU, GPU |
对每个输出执行来自图像批处理的多次粘贴。 |
|
CPU |
|
|
CPU |
|
|
CPU, GPU |
在音频缓冲区中执行前导和尾随静音检测。 |
|
CPU, GPU |
生成遵循正态分布的随机数。 |
|
CPU, GPU |
通过移除均值并除以标准差来归一化输入。 |
|
CPU, GPU |
调用 njit 编译的 Numba 函数。 |
|
CPU, GPU |
|
|
CPU, GPU |
生成输入的 one-hot 编码。 |
|
CPU |
返回具有给定形状和类型的新数据,并用 1 填充。 |
|
CPU |
返回与输入数组具有相同形状和类型的新数据,并用 1 填充。 |
|
GPU |
计算输入中图像之间的光流。 |
|
CPU, GPU |
在指定的轴中用 fill_value 填充所有样本,以匹配这些轴中批处理中的最大范围或匹配指定的最小形状。 |
|
GPU |
将输入图像粘贴到更大的画布上,其中画布大小等于 |
|
CPU |
获取编码图像的形状。 |
|
CPU, GPU |
将输入张量标记为序列。 |
|
CPU, GPU |
返回通过根据 indices 参数中给出的索引从输入中选择张量而构造的张量批次。 |
|
CPU |
计算信号的功率谱。 |
|
CPU, GPU |
对输入数据应用预加重滤波器。 |
|
CPU, GPU |
执行 Python 函数。 |
|
CPU |
对图像坐标空间应用前瞻性随机裁剪,同时保持边界框,并可选择保持标签一致。 |
|
CPU |
生成具有随机选择的面积和纵横比的裁剪窗口。 |
|
CPU, GPU |
执行具有随机选择的面积和纵横比的裁剪,并将其调整为指定的大小。 |
|
CPU, GPU |
将输入的内容视为具有不同的类型、形状和/或布局。 |
|
CPU, GPU |
将输入的内容视为具有不同的形状和/或布局。 |
|
CPU, GPU |
调整图像大小。 |
|
CPU, GPU |
执行融合调整大小、裁剪、镜像操作。 |
|
CPU |
生成固定形状的裁剪窗口,随机放置,以便尽可能多地包含提供的感兴趣区域 (ROI)。 |
|
CPU, GPU |
将图像旋转指定的角度。 |
|
CPU, GPU |
更改图像的饱和度级别。 |
|
CPU |
|
|
CPU, GPU |
重新排列序列中的帧。 |
|
CPU, GPU |
返回输入批次中张量的形状。 |
|
CPU, GPU |
提取子张量或切片。 |
|
CPU, GPU |
从一维信号(例如,音频)生成频谱图。 |
|
CPU, GPU |
执行球体增强。 |
|
CPU, GPU |
移除作为 axes 或 axis_names 给出的维度。 |
|
CPU |
执行带有边界框的随机裁剪,其中 Intersection Over Union (IoU) 满足 0-1 之间随机选择的阈值。 |
|
CPU, GPU |
沿着新轴连接输入张量。 |
|
CPU |
|
|
CPU, GPU |
将幅度(实数,正数)转换为分贝刻度。 |
|
CPU, GPU |
执行对 Torch 张量进行操作的函数。 |
|
CPU, GPU |
通过基于 perm 参数重新排序维度来转置张量。 |
|
CPU, GPU |
生成遵循均匀分布的随机数。 |
|
GPU |
|
|
GPU |
|
|
CPU, GPU |
对图像应用仿射变换。 |
|
CPU, GPU |
执行水增强,使图像看起来像在水下。 |
|
CPU |
返回具有给定形状和类型的新数据,并用零填充。 |
|
CPU |
返回与输入数组具有相同形状和类型的新数据,并用零填充。 |