nvidia.dali.fn.reductions.sum#

nvidia.dali.fn.reductions.sum(__input, /, *, axes=None, axis_names=None, bytes_per_sample_hint=[0], dtype=None, keep_dims=False, preserve=False, device=None, name=None)#

获取沿指定轴的元素总和。

支持的后端
  • ‘cpu’

  • ‘gpu’

参数:

__input (TensorList) – 算子的输入。

关键字参数:
  • axes (intint 列表, 可选) –

    执行缩减的轴或多个轴。

    接受的范围是 [-ndim, ndim-1]。负索引从后往前计数。

    不提供任何轴将导致所有元素的缩减。

  • axis_names (layout str, 可选) –

    执行缩减的轴或多个轴的名称。

    输入布局用于将轴名称转换为轴索引,例如,当输入布局为 “FHWC” 时,axis_names="HW" 等效于指定 axes=[1,2]。此参数不能与 axes 一起使用。

  • bytes_per_sample_hint (int 或 int 列表, 可选, 默认 = [0]) –

    输出大小提示,以每样本字节数为单位。

    如果指定,则算子的输出(位于 GPU 或页锁定主机内存中)将被预先分配以容纳此大小的批次样本。

  • dtype (nvidia.dali.types.DALIDataType, 可选) – 输出数据类型。此类型用于累积结果。

  • keep_dims (bool, 可选, 默认 = False) – 如果为 True,则保持原始输入维度。

  • preserve (bool, 可选, 默认 = False) – 阻止算子从图中移除,即使其输出未使用。