nvidia.dali.fn.roi_random_crop#
- nvidia.dali.fn.roi_random_crop(__input=None, /, *, bytes_per_sample_hint=[0], crop_shape, in_shape=None, preserve=False, roi_end=None, roi_shape=None, roi_start, seed=-1, device=None, name=None)#
生成固定形状的裁剪窗口,随机放置,以便尽可能多地包含提供的感兴趣区域 (ROI)。
如果 ROI 大于裁剪窗口,则裁剪窗口将是 ROI 的子窗口。如果 ROI 小于裁剪窗口,则整个 ROI 应包含在裁剪窗口中。
如果给定了输入形状 (
in_shape
),则选择生成的裁剪窗口使其在输入形状的边界内。或者,可以将要裁剪的输入数据传递给运算符,在运算符中。当提供输入形状时,感兴趣区域应在输入边界内,并且裁剪窗口形状不应大于输入形状。如果未提供输入形状,则生成的裁剪窗口是无界的,可能会导致超出边界的裁剪。
裁剪窗口尺寸应显式提供 (
crop_shape
),并且 ROI 应使用roi_start
/roi_end
或roi_start
/roi_shape
指定。该运算符生成表示裁剪窗口起始坐标的输出。
- 支持的后端
‘cpu’
- 参数:
__input¶ (TensorList, 可选) – 运算符的输入。
- 关键字参数:
bytes_per_sample_hint¶ (int 或 list of int, 可选, 默认 = [0]) –
每个样本的输出大小提示(以字节为单位)。
如果指定,则将预先分配驻留在 GPU 或分页锁定主机内存中的运算符输出,以适应此大小的样本批次。
crop_shape¶ (int 或 list of int 或 TensorList of int) – 裁剪窗口尺寸。
in_shape¶ (int 或 list of int 或 TensorList of int, 可选) –
输入数据的形状。
如果提供,则将选择裁剪窗口的起始位置,以使裁剪窗口在输入的边界内。
注意
提供
in_shape
与直接将输入数据作为位置输入馈送不兼容。preserve¶ (bool, 可选, 默认 = False) – 即使运算符的输出未使用,也阻止将其从图中删除。
roi_end¶ (int 或 list of int 或 TensorList of int, 可选) –
ROI 结束坐标。
roi_shape¶ (int 或 list of int 或 TensorList of int, 可选) –
ROI 形状。
roi_start¶ (int 或 list of int 或 TensorList of int) – ROI 起始坐标。
seed¶ (int, 可选, 默认 = -1) – 随机种子;如果未设置,将自动分配一个。