padding.h

处理 padding 的函数。

函数

void nvte_multi_padding(size_t num_tensors, const NVTETensor *input_list, NVTETensor *output_list, const int *padded_num_rows_list, cudaStream_t stream)

Padding 多个张量。

注意:Padding 模式仅支持底部。

例如,将 3x3 矩阵 padding 到 4x3 矩阵。

来源 | 1 | 2 | 3 | | 4 | 5 | 6 | | 7 | 8 | 9 |

目标 | 1 | 2 | 3 | | 4 | 5 | 6 | | 7 | 8 | 9 | | 0 | 0 | 0 |

参数:
  • num_tensors[in] 张量数量。

  • input_list[in] 2D 输入张量列表。

  • output_list[inout] padding 后的张量列表。维度与 input_list 中的张量匹配。

  • padded_num_rows_list[in] 与输入张量对应的 padding 后的行数列表。

  • stream[in] 用于操作的 CUDA 流。