nvidia.dali.fn.experimental.resize#

nvidia.dali.fn.experimental.resize(__input, /, *, antialias=True, bytes_per_sample_hint=[0], dtype=None, interp_type=DALIInterpType.INTERP_LINEAR, mag_filter=DALIInterpType.INTERP_LINEAR, max_size=None, min_filter=DALIInterpType.INTERP_LINEAR, minibatch_size=32, mode='default', preserve=False, resize_longer=0.0, resize_shorter=0.0, resize_x=0.0, resize_y=0.0, resize_z=0.0, roi_end=None, roi_relative=False, roi_start=None, save_attrs=False, size=None, subpixel_scale=True, temp_buffer_hint=0, device=None, name=None)#

调整图像大小。

此操作符允许序列输入并支持体积数据。

支持的后端
  • ‘gpu’

参数:

__input (TensorList ('HWC', 'FHWC', 'CHW', 'FCHW', 'CFHW', 'DHWC', 'FDHWC', 'CDHW', 'FCDHW', 'CFDHW')) – 操作符的输入。

关键词参数:
  • antialias (bool, optional, default = True) –

    如果启用,则在缩小比例时应用抗锯齿滤波器。

    注意

    最近邻插值不支持抗锯齿。

  • bytes_per_sample_hint (int or list of int, optional, default = [0]) –

    输出大小提示,以字节/样本为单位。

    如果指定,则驻留在 GPU 或页锁定主机内存中的操作符输出将被预分配以容纳此大小的样本批次。

  • dtype (nvidia.dali.types.DALIDataType, optional) –

    输出数据类型。

    必须与输入类型相同或为 float。如果未设置,则使用输入类型。

  • image_type (nvidia.dali.types.DALIImageType) –

    警告

    参数 image_type 已不再使用,并将在未来的版本中删除。

  • interp_type (nvidia.dali.types.DALIInterpType or TensorList of nvidia.dali.types.DALIInterpType, optional, default = DALIInterpType.INTERP_LINEAR) –

    要使用的插值类型。

    使用 min_filtermag_filter 来为缩小和放大指定不同的滤波。

    注意

    现在不建议使用 INTERP_TRIANGULAR,应将其替换为

    启用 antialias 的 INTERP_LINEAR 的组合。

  • mag_filter (nvidia.dali.types.DALIInterpType or TensorList of nvidia.dali.types.DALIInterpType, optional, default = DALIInterpType.INTERP_LINEAR) – 放大时使用的滤波器。

  • max_size (float or list of float, optional) –

    输出大小的限制。

    当操作符配置为保持宽高比且仅指定较小尺寸时,其他尺寸可能会变得非常大。 当使用 resize_shorter 参数或 “not_smaller” 模式或当某些范围未指定时,可能会发生这种情况。

    此参数限制了输出可以变得多大。 此值可以按轴指定,也可以对所有轴统一指定。

    注意

    当与 “not_smaller” 模式或 resize_shorter 参数一起使用时,max_size 优先,并且保持宽高比 - 例如,使用 mode="not_smaller", size=800, max_size=1400 调整大小,大小为 1200x600 的图像将调整为 1400x700。

  • min_filter (nvidia.dali.types.DALIInterpType or TensorList of nvidia.dali.types.DALIInterpType, optional, default = DALIInterpType.INTERP_LINEAR) – 缩小时使用的滤波器。

  • minibatch_size (int, optional, default = 32) – 内核调用中处理的最大图像数量。

  • mode (str, optional, default = ‘default’) –

    调整大小模式。

    以下是支持的模式列表

    • "default" - 图像调整为指定大小。
      缺失的范围会使用提供的范围的平均比例进行缩放。
    • "stretch" - 图像调整为指定大小。
      缺失的范围根本不缩放。
    • "not_larger" - 图像调整大小,保持宽高比,以便输出图像的任何范围都不超过指定大小。
      例如,1280x720 的图像,期望的输出大小为 640x480,实际生成 640x360 的输出。
    • "not_smaller" - 图像调整大小,保持宽高比,以便输出图像的任何范围都不小于指定大小。
      例如,640x480 的图像,期望的输出大小为 1920x1080,实际生成 1920x1440 的输出。

      此参数与 resize_longerresize_shorter 互斥

  • preserve (bool, optional, default = False) – 阻止操作符从图中移除,即使其输出未使用。

  • resize_longer (float or TensorList of float, optional, default = 0.0) –

    调整大小的图像的较长维度的长度。

    此选项与 resize_shorter 和显式大小参数互斥,并且操作符保持原始图像的宽高比。 此选项等效于为所有维度指定相同的大小和 mode="not_larger"

  • resize_shorter (float or TensorList of float, optional, default = 0.0) –

    调整大小的图像的较短维度的长度。

    此选项与 resize_longer 和显式大小参数互斥,并且操作符保持原始图像的宽高比。 此选项等效于为所有维度指定相同的大小和 mode="not_smaller"。 可以通过设置 max_size 参数来限制较长维度。 有关更多信息,请参阅 max_size 参数文档。

  • resize_x (float or TensorList of float, optional, default = 0.0) –

    调整大小的图像的 X 维度的长度。

    此选项与 resize_shorterresize_longersize 互斥。 如果未指定 resize_y 或为 0,则操作符保持原始图像的宽高比。 负值会翻转图像。

  • resize_y (float or TensorList of float, optional, default = 0.0) –

    调整大小的图像的 Y 维度的长度。

    此选项与 resize_shorterresize_longersize 互斥。 如果未指定 resize_x 或为 0,则操作符保持原始图像的宽高比。 负值会翻转图像。

  • resize_z (float or TensorList of float, optional, default = 0.0) –

    调整大小的体积的 Z 维度的长度。

    此选项与 resize_shorterresize_longersize 互斥。 如果 resize_xresize_y 未指定或为 0,则操作将保持原始体积的宽高比。 负值会翻转体积。

  • roi_end (float or list of float or TensorList of float, optional) –

    输入感兴趣区域 (ROI) 的结束位置。

    必须与 roi_start 一起指定。 坐标遵循张量形状顺序,这与 size 相同。 坐标可以是绝对坐标(以像素为单位,这是默认值)或相对坐标 (0..1),具体取决于 relative_roi 参数的值。 如果任何维度中的 ROI 原点大于 ROI 终点,则该区域在该维度中翻转。

  • roi_relative (bool, optional, default = False) – 如果为 true,则 ROI 坐标相对于输入大小,其中 0 表示顶部/左侧,1 表示底部/右侧

  • roi_start (float or list of float or TensorList of float, optional) –

    输入感兴趣区域 (ROI) 的原点。

    必须与 roi_end 一起指定。 坐标遵循张量形状顺序,这与 size 相同。 坐标可以是绝对坐标(以像素为单位,这是默认值)或相对坐标 (0..1),具体取决于 relative_roi 参数的值。 如果任何维度中的 ROI 原点大于 ROI 终点,则该区域在该维度中翻转。

  • save_attrs (bool, optional, default = False) – 保存 reshape 属性以进行测试。

  • size(尺寸) (floatfloat 列表float 的 TensorList可选) –

    期望的输出尺寸。

    必须是列表/元组,每个空间维度一个条目,视频帧和通道除外。 尺寸为 0 的维度将被视作不存在,输出尺寸将基于其他维度和 mode(模式) 参数计算。

  • subpixel_scale(亚像素缩放) (bool, optional, default = True) –

    如果为 True,直接指定或计算的分数尺寸将导致调整输入 ROI 以保持缩放因子。

    否则,将调整缩放因子,以便源图像映射到四舍五入的输出尺寸。

  • temp_buffer_hint(临时缓冲区提示) (int, optional, default = 0) –

    用于重采样的临时缓冲区的初始大小(以字节为单位)。

    注意

    对于 CPU 变体,此参数将被忽略。