nvidia.dali.fn.reductions.sum#

nvidia.dali.fn.reductions.sum(__input, /, *, axes=None, axis_names=None, bytes_per_sample_hint=[0], dtype=None, keep_dims=False, preserve=False, device=None, name=None)#

获取沿指定轴的元素总和。

支持的后端

‘cpu’
‘gpu’

参数:

__input¶ (TensorList) – 算子的输入。

关键字参数:

axes¶ (int 或 int 列表, 可选) –
执行缩减的轴或多个轴。

接受的范围是 [-ndim, ndim-1]。负索引从后往前计数。

不提供任何轴将导致所有元素的缩减。
axis_names¶ (layout str, 可选) –
执行缩减的轴或多个轴的名称。

输入布局用于将轴名称转换为轴索引，例如，当输入布局为 “FHWC” 时，axis_names="HW" 等效于指定 axes=[1,2]。此参数不能与 axes 一起使用。
bytes_per_sample_hint¶ (int 或 int 列表, 可选, 默认 = [0]) –
输出大小提示，以每样本字节数为单位。

如果指定，则算子的输出（位于 GPU 或页锁定主机内存中）将被预先分配以容纳此大小的批次样本。
dtype¶ (nvidia.dali.types.DALIDataType, 可选) – 输出数据类型。此类型用于累积结果。
keep_dims¶ (bool, 可选, 默认 = False) – 如果为 True，则保持原始输入维度。
preserve¶ (bool, 可选, 默认 = False) – 阻止算子从图中移除，即使其输出未使用。