padding.h
处理 padding 的函数。
函数
-
void nvte_multi_padding(size_t num_tensors, const NVTETensor *input_list, NVTETensor *output_list, const int *padded_num_rows_list, cudaStream_t stream)
Padding 多个张量。
注意:Padding 模式仅支持底部。
例如,将 3x3 矩阵 padding 到 4x3 矩阵。
来源 | 1 | 2 | 3 | | 4 | 5 | 6 | | 7 | 8 | 9 |
目标 | 1 | 2 | 3 | | 4 | 5 | 6 | | 7 | 8 | 9 | | 0 | 0 | 0 |
- 参数:
num_tensors – [in] 张量数量。
input_list – [in] 2D 输入张量列表。
output_list – [inout] padding 后的张量列表。维度与 input_list 中的张量匹配。
padded_num_rows_list – [in] 与输入张量对应的 padding 后的行数列表。
stream – [in] 用于操作的 CUDA 流。