nvidia.dali.fn#
下表列出了 nvidia.dali.fn
模块中所有可用的操作
函数 |
设备支持 |
简短描述 |
---|---|---|
CPU |
|
|
CPU, GPU |
重采样音频信号。 |
|
CPU |
生成一批随机整数,可用作索引,用于索引批次中的样本。 |
|
CPU, GPU |
水平或垂直翻转(镜像)边界框。 |
|
CPU |
变换边界框,以便在图像粘贴到更大的画布上后,框保持在图像中的相同位置。 |
|
CPU, GPU |
使用作为参数传递的一组默认框(锚框)对输入边界框和标签进行编码。 |
|
CPU, GPU |
调整图像的亮度。 |
|
CPU, GPU |
调整图像的亮度和对比度。 |
|
CPU |
|
|
CPU |
|
|
CPU, GPU |
将张量转换为不同的类型。 |
|
CPU, GPU |
将第一个张量转换为第二个张量的类型。 |
|
CPU, GPU |
沿现有轴连接输入张量。 |
|
CPU |
|
|
CPU, GPU |
生成遵循伯努利分布的随机布尔值。 |
|
CPU, GPU |
在各种图像颜色模型之间转换。 |
|
CPU, GPU |
调整图像的色调、饱和度、亮度和对比度。 |
|
CPU, GPU |
调整图像的对比度。 |
|
CPU, GPU |
通过相对于给定中心翻转(反射)坐标来变换向量或点。 |
|
CPU, GPU |
对点或向量应用线性变换。 |
|
CPU, GPU |
创建输入张量的副本。 |
|
CPU, GPU |
使用指定的窗口尺寸和窗口位置(左上角)裁剪图像。 |
|
CPU, GPU |
执行融合裁剪、归一化、格式转换(NHWC 到 NCHW)(如果需要)和类型转换。 |
|
CPU, GPU |
执行对 DLPack 张量进行操作的 Python 函数。 |
|
CPU, GPU |
将批量图像以 PPM 格式保存到磁盘。 |
|
CPU, GPU |
从输入序列中提取一个或多个元素。 |
|
CPU, GPU |
从输入张量中擦除一个或多个区域。 |
|
CPU, GPU |
插入新的维度,其范围为 1 到数据形状。 |
|
CPU, GPU |
允许将外部提供的数据作为 pipeline 的输入传递。 |
|
CPU, GPU |
ResizedCropMirror 的旧版别名,默认情况下禁用抗锯齿。 |
|
CPU |
|
|
CPU, GPU |
在选定的维度(水平、垂直和深度方向)翻转图像。 |
|
CPU |
返回给定形状和类型的新数据,并填充填充值。 |
|
CPU |
返回与输入数据具有相同形状和类型的新数据,并填充 fill_value。 |
|
CPU, GPU |
对输入应用高斯模糊。 |
|
CPU, GPU |
返回作为输入传递的张量的属性。 |
|
CPU, GPU |
执行 gridmask 增强 (https://arxiv.org/abs/2001.04086)。 |
|
CPU, GPU |
调整图像的色调、饱和度和值(亮度)。 |
|
CPU, GPU |
更改图像的色调级别。 |
|
CPU, 混合 |
|
|
CPU, 混合 |
|
|
CPU, 混合 |
|
|
CPU, 混合 |
|
|
GPU |
执行随机 Jitter 增强。 |
|
CPU, GPU |
向 RGB 图像引入 JPEG 压缩伪影。 |
|
CPU, GPU |
计算输入的拉普拉斯算子。 |
|
CPU, GPU |
通过使用由 keys 和 values 指定的查找表以及未指定键的 default_value 将输入映射到输出。 |
|
CPU, GPU |
通过应用三角滤波器组将频谱图转换为 mel 频谱图。 |
|
CPU, GPU |
从 mel 频谱图计算梅尔频率倒谱系数 (MFCC)。 |
|
CPU, GPU |
执行从图像批次到每个输出的多次粘贴。 |
|
CPU |
|
|
CPU |
|
|
CPU, GPU |
在音频缓冲区中执行前导和尾随静音检测。 |
|
CPU, GPU |
生成遵循正态分布的随机数。 |
|
CPU, GPU |
通过删除均值并除以标准差来归一化输入。 |
|
CPU, GPU |
调用 njit 编译的 Numba 函数。 |
|
CPU, GPU |
|
|
CPU, GPU |
生成输入的 one-hot 编码。 |
|
CPU |
返回给定形状和类型的新数据,并填充 1。 |
|
CPU |
返回与输入数组具有相同形状和类型的新数据,并填充 1。 |
|
GPU |
计算输入中图像之间的光流。 |
|
CPU, GPU |
在指定的轴中用 fill_value 填充所有样本,以匹配这些轴中批次的最大范围或匹配指定的最小形状。 |
|
GPU |
将输入图像粘贴到更大的画布上,其中画布大小等于 |
|
CPU |
获取编码图像的形状。 |
|
CPU, GPU |
将输入张量标记为序列。 |
|
CPU, GPU |
返回一批张量,这些张量是通过根据 indices 参数中给出的索引从输入中选择张量来构造的。 |
|
CPU |
计算信号的功率谱。 |
|
CPU, GPU |
将预加重滤波器应用于输入数据。 |
|
CPU, GPU |
执行 Python 函数。 |
|
CPU |
对图像坐标空间应用前瞻性随机裁剪,同时保持边界框,以及可选的标签的一致性。 |
|
CPU |
生成具有随机选择的面积和纵横比的裁剪窗口。 |
|
CPU, GPU |
执行具有随机选择的面积和纵横比的裁剪,并将其调整为指定大小。 |
|
CPU, GPU |
将输入的内容视为具有不同的类型、形状和/或布局。 |
|
CPU, GPU |
将输入的内容视为具有不同的形状和/或布局。 |
|
CPU, GPU |
调整图像大小。 |
|
CPU, GPU |
执行融合的调整大小、裁剪、镜像操作。 |
|
CPU |
生成固定形状的裁剪窗口,随机放置,以便尽可能多地包含提供的感兴趣区域 (ROI)。 |
|
CPU, GPU |
将图像旋转指定的角度。 |
|
CPU, GPU |
更改图像的饱和度级别。 |
|
CPU |
|
|
CPU, GPU |
重新排列序列中的帧。 |
|
CPU, GPU |
返回输入批次中张量的形状。 |
|
CPU, GPU |
提取子张量或切片。 |
|
CPU, GPU |
从一维信号(例如,音频)生成频谱图。 |
|
CPU, GPU |
执行球体增强。 |
|
CPU, GPU |
删除作为 axes 或 axis_names 给出的维度。 |
|
CPU |
执行带有边界框的随机裁剪,其中交并比 (IoU) 满足 0-1 之间随机选择的阈值。 |
|
CPU, GPU |
沿新轴连接输入张量。 |
|
CPU |
|
|
CPU, GPU |
将幅度(实数,正数)转换为分贝刻度。 |
|
CPU, GPU |
执行对 Torch 张量进行操作的函数。 |
|
CPU, GPU |
通过基于 perm 参数重新排序维度来转置张量。 |
|
CPU, GPU |
生成遵循均匀分布的随机数。 |
|
GPU |
|
|
GPU |
|
|
CPU, GPU |
对图像应用仿射变换。 |
|
CPU, GPU |
执行水增强,使图像看起来像在水下。 |
|
CPU |
返回给定形状和类型的新数据,并填充零。 |
|
CPU |
返回与输入数组具有相同形状和类型的新数据,并填充零。 |