nvidia.dali.fn.roi_random_crop#
- nvidia.dali.fn.roi_random_crop(__input=None, /, *, bytes_per_sample_hint=[0], crop_shape, in_shape=None, preserve=False, roi_end=None, roi_shape=None, roi_start, seed=-1, device=None, name=None)#
生成一个固定形状的裁剪窗口,随机放置,以便尽可能多地包含提供的感兴趣区域 (ROI)。
如果 ROI 大于裁剪窗口,则裁剪窗口将是 ROI 的子窗口。如果 ROI 小于裁剪窗口,则整个 ROI 应包含在裁剪窗口中。
如果给定了输入形状 (
in_shape
),则选择生成的裁剪窗口使其在输入形状的边界内。或者,可以将要裁剪的输入数据传递给操作符,在操作符中。当提供输入形状时,感兴趣区域应在输入的边界内,并且裁剪窗口形状不应大于输入形状。如果未提供输入形状,则生成的裁剪窗口是无界的,可能会导致超出边界的裁剪。
裁剪窗口尺寸应显式提供 (
crop_shape
),并且 ROI 应使用roi_start
/roi_end
或roi_start
/roi_shape
指定。该操作符生成表示裁剪窗口起始坐标的输出。
- 支持的后端
‘cpu’
- 参数:
__input¶ (TensorList, 可选) – 操作符的输入。
- 关键字参数:
bytes_per_sample_hint¶ (int 或 list of int, 可选, 默认 = [0]) –
每个样本的输出大小提示(以字节为单位)。
如果指定,则驻留在 GPU 或页锁定主机内存中的操作符输出将预先分配,以适应此大小的样本批次。
crop_shape¶ (int 或 list of int 或 TensorList of int) – 裁剪窗口尺寸。
in_shape¶ (int 或 list of int 或 TensorList of int, 可选) –
输入数据的形状。
如果提供,则将选择裁剪窗口的起始位置,以便裁剪窗口在输入的边界内。
注意
提供
in_shape
与直接将输入数据作为位置输入馈送不兼容。preserve¶ (bool, 可选, 默认 = False) – 阻止操作符从图中移除,即使其输出未使用。
roi_end¶ (int 或 list of int 或 TensorList of int, 可选) –
ROI 结束坐标。
roi_shape¶ (int 或 list of int 或 TensorList of int, 可选) –
ROI 形状。
roi_start¶ (int 或 list of int 或 TensorList of int) – ROI 起始坐标。
seed¶ (int, 可选, 默认 = -1) – 随机种子;如果未设置,将自动分配一个。