cuBB 开发者指南#
Aerial CUDA 加速 RAN 是一组软件定义库,经过优化可在 GPU 上运行 5G gNB 工作负载。这些库包括 cuPHY、cuMAC 和 pyAerial。在本节中,我们重点介绍由 3GPP [1-5] 定义的 5G gNB 软件堆栈的第 1 层 (L1) 或物理 (PHY) 层。
cuPHY 是 Aerial CUDA 加速 RAN 的 5G L1 库。它被设计为在 NVIDIA GPU 上运行的内联加速器,并且不需要任何额外的硬件加速器。它根据 O-RAN 7.2 分割选项 [8] 实现。cuPHY 库利用大规模并行 GPU 架构来加速计算密集型信号处理任务。它还利用 NVIDIA Bluefield-3 (BF3) NIC 和 GPU 之间快速的 GPU I/O 接口(GPU Direct RDMA [7])来改善延迟。
BF3 NIC 除了符合 IEEE 1588 标准的时序同步外,还提供前传 (FH) 连接。BF3 NIC 还具有内置的 SyncE 和 eCPRI 开窗功能,满足 G.8273.2 时序要求。
下面,我们首先概述 cuPHY 库软件堆栈。cuPHY 库由在 CPU 上运行的 L1 控制器组件和在 GPU 上运行的 PHY 层功能组成。在提供概述之后,我们将详细介绍每个组件,并解释 L1 控制器组件如何相互交互以及如何与 L2 交互。最后,我们将介绍作为 CUDA 内核实现加速的 PHY 层信号处理功能。

5G gNB DU 中的 Aerial CUDA 加速软件堆栈#