nvidia.dali.fn.roi_random_crop#

nvidia.dali.fn.roi_random_crop(__input=None, /, *, bytes_per_sample_hint=[0], crop_shape, in_shape=None, preserve=False, roi_end=None, roi_shape=None, roi_start, seed=-1, device=None, name=None)#

生成一个固定形状的裁剪窗口,随机放置,以便尽可能多地包含提供的感兴趣区域 (ROI)。

如果 ROI 大于裁剪窗口,则裁剪窗口将是 ROI 的子窗口。如果 ROI 小于裁剪窗口,则整个 ROI 应包含在裁剪窗口中。

如果给定了输入形状 ( in_shape ),则选择生成的裁剪窗口使其在输入形状的边界内。或者,可以将要裁剪的输入数据传递给操作符,在操作符中。当提供输入形状时,感兴趣区域应在输入的边界内,并且裁剪窗口形状不应大于输入形状。

如果未提供输入形状,则生成的裁剪窗口是无界的,可能会导致超出边界的裁剪。

裁剪窗口尺寸应显式提供 ( crop_shape ),并且 ROI 应使用 roi_start / roi_endroi_start / roi_shape 指定。

该操作符生成表示裁剪窗口起始坐标的输出。

支持的后端
  • ‘cpu’

参数:

__input (TensorList, 可选) – 操作符的输入。

关键字参数:
  • bytes_per_sample_hint (int 或 list of int, 可选, 默认 = [0]) –

    每个样本的输出大小提示(以字节为单位)。

    如果指定,则驻留在 GPU 或页锁定主机内存中的操作符输出将预先分配,以适应此大小的样本批次。

  • crop_shape (intlist of intTensorList of int) – 裁剪窗口尺寸。

  • in_shape (intlist of intTensorList of int, 可选) –

    输入数据的形状。

    如果提供,则将选择裁剪窗口的起始位置,以便裁剪窗口在输入的边界内。

    注意

    提供 in_shape 与直接将输入数据作为位置输入馈送不兼容。

  • preserve (bool, 可选, 默认 = False) – 阻止操作符从图中移除,即使其输出未使用。

  • roi_end (intlist of intTensorList of int, 可选) –

    ROI 结束坐标。

    注意

    使用 roi_endroi_shape 互斥。

  • roi_shape (intlist of intTensorList of int, 可选) –

    ROI 形状。

    注意

    使用 roi_shaperoi_end 互斥。

  • roi_start (intlist of intTensorList of int) – ROI 起始坐标。

  • seed (int, 可选, 默认 = -1) – 随机种子;如果未设置,将自动分配一个。