cuBB 开发者指南#

Aerial CUDA 加速 RAN 是一组软件定义库,经过优化可在 GPU 上运行 5G gNB 工作负载。这些库包括 cuPHY、cuMAC 和 pyAerial。在本节中,我们重点介绍由 3GPP [1-5] 定义的 5G gNB 软件堆栈的第 1 层 (L1) 或物理 (PHY) 层。

cuPHY 是 Aerial CUDA 加速 RAN 的 5G L1 库。它被设计为在 NVIDIA GPU 上运行的内联加速器,并且不需要任何额外的硬件加速器。它根据 O-RAN 7.2 分割选项 [8] 实现。cuPHY 库利用大规模并行 GPU 架构来加速计算密集型信号处理任务。它还利用 NVIDIA Bluefield-3 (BF3) NIC 和 GPU 之间快速的 GPU I/O 接口(GPU Direct RDMA [7])来改善延迟。

BF3 NIC 除了符合 IEEE 1588 标准的时序同步外,还提供前传 (FH) 连接。BF3 NIC 还具有内置的 SyncE 和 eCPRI 开窗功能,满足 G.8273.2 时序要求。

下面,我们首先概述 cuPHY 库软件堆栈。cuPHY 库由在 CPU 上运行的 L1 控制器组件和在 GPU 上运行的 PHY 层功能组成。在提供概述之后,我们将详细介绍每个组件,并解释 L1 控制器组件如何相互交互以及如何与 L2 交互。最后,我们将介绍作为 CUDA 内核实现加速的 PHY 层信号处理功能。

../../_images/aerial_cuda_acceleratred_sw_stack.png

5G gNB DU 中的 Aerial CUDA 加速软件堆栈#