nvidia.dali.fn.fast_resize_crop_mirror#

nvidia.dali.fn.fast_resize_crop_mirror(__input, /, *, antialias=False, bytes_per_sample_hint=[0], crop=None, crop_d=0.0, crop_h=0.0, crop_pos_x=0.5, crop_pos_y=0.5, crop_pos_z=0.5, crop_w=0.0, dtype=None, interp_type=DALIInterpType.INTERP_LINEAR, mag_filter=DALIInterpType.INTERP_LINEAR, max_size=None, min_filter=DALIInterpType.INTERP_LINEAR, minibatch_size=32, mirror=0, mode='default', preserve=False, resize_longer=0.0, resize_shorter=0.0, resize_x=0.0, resize_y=0.0, resize_z=0.0, roi_end=None, roi_relative=False, roi_start=None, rounding='round', size=None, subpixel_scale=True, temp_buffer_hint=0, device=None, name=None)#

警告

此操作符已弃用。请使用 resize_crop_mirror() 代替。

ResizedCropMirror 的旧别名,默认禁用抗锯齿。

此操作符允许序列输入并支持体积数据。

支持的后端
  • ‘cpu’

  • ‘gpu’

参数:

__input (TensorList ('HWC', 'FHWC', 'CHW', 'FCHW', 'CFHW', 'DHWC', 'FDHWC', 'CDHW', 'FCDHW', 'CFDHW')) – 操作符的输入。

关键字参数:
  • antialias (bool, optional, default = False) –

    如果启用,则在缩小比例时应用抗锯齿滤波器。

    注意

    最近邻插值不支持抗锯齿。

  • bytes_per_sample_hint (int 或 list of int, optional, default = [0]) –

    每个样本的输出大小提示,以字节为单位。

    如果指定,则驻留在 GPU 或页锁定主机内存中的操作符输出将被预分配以容纳此大小的一批样本。

  • crop (floatlist of floatTensorList of float, optional) –

    裁剪图像的形状,指定为值列表(例如,对于 2D 裁剪为 (crop_H, crop_W),对于体积裁剪为 (crop_D, crop_H, crop_W))。

    提供 crop 参数与提供单独的参数(如 crop_dcrop_hcrop_w)不兼容。

  • crop_d (float 或 TensorList of float, optional, default = 0.0) –

    适用于体积输入;裁剪窗口深度(以体素为单位)。

    crop_wcrop_hcrop_d 必须一起指定。为 crop_wcrop_hcrop_d 提供值与提供固定裁剪窗口尺寸(参数 crop)不兼容。

  • crop_h (float 或 TensorList of float, optional, default = 0.0) –

    裁剪窗口高度(以像素为单位)。

    crop_wcrop_h 提供值与提供固定裁剪窗口尺寸(参数 crop)不兼容。

  • crop_pos_x (float 或 TensorList of float, optional, default = 0.5) –

    裁剪窗口水平位置的归一化值 (0.0 - 1.0)(左上角)。

    实际位置计算为 crop_x = crop_x_norm * (W - crop_W),其中 crop_x_norm 是归一化位置,W 是图像宽度,crop_W 是裁剪窗口宽度。

    有关 crop_x 如何转换为整数值的更多详细信息,请参阅 rounding 参数。

  • crop_pos_y (float 或 TensorList of float, optional, default = 0.5) –

    裁剪窗口起始位置(通常为左上角)的归一化垂直位置 (0.0 - 1.0)。

    实际位置计算为 crop_y = crop_y_norm * (H - crop_H),其中 crop_y_norm 是归一化位置,H 是图像高度,crop_H 是裁剪窗口高度。

    有关 crop_y 如何转换为整数值的更多详细信息,请参阅 rounding 参数。

  • crop_pos_z (float 或 TensorList of float, optional, default = 0.5) –

    适用于体积输入。

    裁剪窗口法线位置的归一化值 (0.0 - 1.0)(前平面)。实际位置计算为 crop_z = crop_z_norm * (D - crop_D),其中 crop_z_norm 是归一化位置,D 是图像深度,crop_D 是裁剪窗口深度。

    有关 crop_z 如何转换为整数值的更多详细信息,请参阅 rounding 参数。

  • crop_w (float 或 TensorList of float, optional, default = 0.0) –

    裁剪窗口宽度(以像素为单位)。

    crop_wcrop_h 提供值与提供固定裁剪窗口尺寸(参数 crop)不兼容。

  • dtype (nvidia.dali.types.DALIDataType, optional) –

    输出数据类型。

    必须与输入类型相同或为 float。如果未设置,则使用输入类型。

  • interp_type (nvidia.dali.types.DALIInterpType 或 TensorList of nvidia.dali.types.DALIInterpType, optional, default = DALIInterpType.INTERP_LINEAR) –

    要使用的插值类型。

    使用 min_filtermag_filter 为缩小和放大指定不同的滤波。

    注意

    现在不建议使用 INTERP_TRIANGULAR,应将其替换为

    启用 antialias 的 INTERP_LINEAR 组合。

  • mag_filter (nvidia.dali.types.DALIInterpType 或 TensorList of nvidia.dali.types.DALIInterpType, optional, default = DALIInterpType.INTERP_LINEAR) – 放大时使用的滤波器。

  • max_size (floatlist of float, optional) –

    输出大小的限制。

    当操作符配置为保持纵横比且仅指定较小尺寸时,另一个(或多个)尺寸可能会变得非常大。当使用 resize_shorter 参数或 “not_smaller” 模式或当某些范围未指定时,可能会发生这种情况。

    此参数限制了输出可以变得多大。此值可以按轴指定,也可以对所有轴统一指定。

    注意

    与 “not_smaller” 模式或 resize_shorter 参数一起使用时,max_size 优先,并且保持纵横比 - 例如,使用 mode="not_smaller", size=800, max_size=1400 调整大小,尺寸为 1200x600 的图像将被调整为 1400x700。

  • min_filter (nvidia.dali.types.DALIInterpTypenvidia.dali.types.DALIInterpType 的 TensorList, 可选, 默认值 = DALIInterpType.INTERP_LINEAR) – 缩小时使用的滤波器。

  • minibatch_size (int, 可选, 默认值 = 32) – 在内核调用中处理的最大图像数量。

  • mirror (int 或 int 的 TensorList, 可选, 默认值 = 0) –

    翻转掩码

    支持的值

    • 0 - 无翻转

    • 1 - 水平翻转

    • 2 - 垂直翻转

    • 4 - 深度翻转

    • 上述任意按位组合

  • mode (str, 可选, 默认值 = ‘default’) –

    调整大小模式。

    以下是支持的模式列表

    • "default" - 图像被调整到指定大小。
      缺失的尺寸会根据提供的尺寸的平均比例进行缩放。
    • "stretch" - 图像被调整到指定大小。
      缺失的尺寸不会被缩放。
    • "not_larger" - 图像被调整大小,保持宽高比,以使输出图像的任何尺寸都不超过指定大小。
      例如,对于 1280x720 的图像,如果期望的输出大小为 640x480,实际输出为 640x360。
    • "not_smaller" - 图像被调整大小,保持宽高比,以使输出图像的任何尺寸都不小于指定大小。
      例如,对于 640x480 的图像,如果期望的输出大小为 1920x1080,实际输出为 1920x1440。

      此参数与 resize_longerresize_shorter 互斥。

  • preserve (bool, 可选, 默认值 = False) – 即使运算符的输出未使用,也阻止其从图中移除。

  • resize_longer (float 或 float 的 TensorList, 可选, 默认值 = 0.0) –

    调整大小后图像较长边的长度。

    此选项与 resize_shorter 和显式大小参数互斥,并且运算符保持原始图像的宽高比。此选项等效于为所有维度指定相同的大小和 mode="not_larger"

  • resize_shorter (float 或 float 的 TensorList, 可选, 默认值 = 0.0) –

    调整大小后图像较短边的长度。

    此选项与 resize_longer 和显式大小参数互斥,并且运算符保持原始图像的宽高比。此选项等效于为所有维度指定相同的大小和 mode="not_smaller"。可以通过设置 max_size 参数来限制较长边的尺寸。有关更多信息,请参阅 max_size 参数文档。

  • resize_x (float 或 float 的 TensorList, 可选, 默认值 = 0.0) –

    调整大小后图像 X 维度的长度。

    此选项与 resize_shorter, resize_longersize 互斥。如果未指定 resize_y 或为 0,则运算符保持原始图像的宽高比。负值会翻转图像。

  • resize_y (float 或 float 的 TensorList, 可选, 默认值 = 0.0) –

    调整大小后图像 Y 维度的长度。

    此选项与 resize_shorter, resize_longersize 互斥。如果未指定 resize_x 或为 0,则运算符保持原始图像的宽高比。负值会翻转图像。

  • resize_z (float 或 float 的 TensorList, 可选, 默认值 = 0.0) –

    调整大小后体积 Z 维度的长度。

    此选项与 resize_shorter, resize_longersize 互斥。如果未指定 resize_xresize_y 或为 0,则运算符将保持原始体积的宽高比。负值会翻转体积。

  • roi_end (floatfloat 列表或 floatTensorList, 可选) –

    输入感兴趣区域 (ROI) 的结束坐标。

    必须与 roi_start 一起指定。坐标遵循张量形状顺序,与 size 相同。坐标可以是绝对坐标(像素,默认)或相对坐标 (0..1),具体取决于 relative_roi 参数的值。如果 ROI 起点在任何维度上都大于 ROI 终点,则该区域在该维度上会被翻转。

  • roi_relative (bool, 可选, 默认值 = False) – 如果为 true,则 ROI 坐标相对于输入大小,其中 0 表示顶部/左侧,1 表示底部/右侧。

  • roi_start (floatfloat 列表或 floatTensorList, 可选) –

    输入感兴趣区域 (ROI) 的起始坐标。

    必须与 roi_end 一起指定。坐标遵循张量形状顺序,与 size 相同。坐标可以是绝对坐标(像素,默认)或相对坐标 (0..1),具体取决于 relative_roi 参数的值。如果 ROI 起点在任何维度上都大于 ROI 终点,则该区域在该维度上会被翻转。

  • rounding (str, 可选, 默认值 = ‘round’) –

    确定用于将窗口起始坐标转换为整数值的舍入函数(参见 crop_pos_x, crop_pos_y, crop_pos_z)。

    可能的值为

    • "round" - 四舍五入到最接近的整数值,中间值远离零舍入。
    • "truncate" - 丢弃数字的小数部分(向零截断)。

  • size (floatfloat 列表或 floatTensorList, 可选) –

    期望的输出大小。

    必须是列表/元组,每个空间维度一个条目,不包括视频帧和通道。尺寸为 0 的维度被视为不存在,输出大小将根据其他尺寸和 mode 参数计算。

  • subpixel_scale (bool, 可选, 默认值 = True) –

    如果为 True,则直接指定或计算的分数大小将导致调整输入 ROI 以保持缩放因子。

    否则,将调整缩放因子,以使源图像映射到舍入后的输出大小。

  • temp_buffer_hint (int, 可选, 默认值 = 0) –

    用于重采样的临时缓冲区的初始大小(以字节为单位)。

    注意

    此参数在 CPU 变体中被忽略。