nvidia.dali.fn.reductions.sum#
- nvidia.dali.fn.reductions.sum(__input, /, *, axes=None, axis_names=None, bytes_per_sample_hint=[0], dtype=None, keep_dims=False, preserve=False, device=None, name=None)#
获取沿指定轴的元素总和。
- 支持的后端
‘cpu’
‘gpu’
- 参数:
__input¶ (TensorList) – 算子的输入。
- 关键字参数:
axes¶ (int 或 int 列表, 可选) –
执行归约的轴或多个轴。
接受范围为 [-ndim, ndim-1]。负索引从末尾计数。
不提供任何轴将导致所有元素的归约。
执行归约的轴或多个轴的名称。
输入布局用于将轴名称转换为轴索引,例如,带有输入布局 “FHWC” 的
axis_names="HW"
等效于指定axes=[1,2]
。此参数不能与axes
一起使用。bytes_per_sample_hint¶ (int 或 int 列表, 可选, 默认值 = [0]) –
输出大小提示,以每样本字节数为单位。
如果指定,则将预先分配驻留在 GPU 或分页锁定主机内存中的运算符输出,以适应此大小的样本批次。
dtype¶ (
nvidia.dali.types.DALIDataType
, 可选) – 输出数据类型。此类型用于累积结果。keep_dims¶ (bool, 可选, 默认值 = False) – 如果为 True,则保持原始输入维度。
preserve¶ (bool, 可选, 默认值 = False) – 阻止运算符从图中移除,即使其输出未使用。