nvidia.dali.fn.reductions.sum#

nvidia.dali.fn.reductions.sum(__input, /, *, axes=None, axis_names=None, bytes_per_sample_hint=[0], dtype=None, keep_dims=False, preserve=False, device=None, name=None)#

获取沿指定轴的元素总和。

支持的后端

‘cpu’
‘gpu’

参数:

__input¶ (TensorList) – 算子的输入。

关键字参数:

axes¶ (int 或 int 列表, 可选) –
执行归约的轴或多个轴。

接受范围为 [-ndim, ndim-1]。负索引从末尾计数。

不提供任何轴将导致所有元素的归约。
axis_names¶ (布局字符串, 可选) –
执行归约的轴或多个轴的名称。

输入布局用于将轴名称转换为轴索引，例如，带有输入布局 “FHWC” 的 axis_names="HW" 等效于指定 axes=[1,2]。此参数不能与 axes 一起使用。
bytes_per_sample_hint¶ (int 或 int 列表, 可选, 默认值 = [0]) –
输出大小提示，以每样本字节数为单位。

如果指定，则将预先分配驻留在 GPU 或分页锁定主机内存中的运算符输出，以适应此大小的样本批次。
dtype¶ (nvidia.dali.types.DALIDataType, 可选) – 输出数据类型。此类型用于累积结果。
keep_dims¶ (bool, 可选, 默认值 = False) – 如果为 True，则保持原始输入维度。
preserve¶ (bool, 可选, 默认值 = False) – 阻止运算符从图中移除，即使其输出未使用。