空中 CUDA 加速 RAN#
空中 CUDA 加速 RAN 整合了用于 5G 和 AI 框架的 Aerial 软件以及 NVIDIA 加速计算平台,从而降低了 TCO (总体拥有成本),并为电信运营商释放了基础设施货币化的潜力。
空中 CUDA 加速 RAN 具有以下主要特性
软件定义、可扩展、模块化、高度可编程且云原生,无需任何固定功能加速器。使生态系统能够灵活地为其商业产品采用必要的模块。
DU L1、DU L2+、CU、UPF 和其他网络功能的 full-stack (全栈) 加速,实现工作负载整合,以获得最佳性能和频谱效率,从而实现一流的系统 TCO (总体拥有成本)。
通用基础设施,具有多租户能力,可以为传统工作负载和前沿 AI 应用提供支持,从而实现一流的 RoA (资产回报率)。
24-3 版本的新增功能
以下是 Aerial CUDA 加速 RAN 24-3 版本中的新增功能
Aerial cuPHY: CUDA 加速的内联 PHY
mMIMO 的多小区支持 (最多 3 个小区)
在特殊时隙中调度 DL
增加 4T4R 和 mMIMO 中的 SRS 时隙
不同 UE 的 SRS CS 复用
PRG 级别的 UL PUSCH 信道估计
RKHS 信道估计
Aerial E2E: 系统级 / 端到端验证
C/U/S 面的前传端口故障转移验证 (主备模式)
完成使用 PRACH 的第 8 章一致性测试
AI + RAN 的 MIG 验证
Aerial Redundancy/Resiliency: CUDA 加速 RAN 冗余/弹性特性
RU 健康监视器 - 主动检测 ORU 的 FH 连接问题并采取纠正措施
引入 L1 恢复期 - 如果 L1 运行延迟,则丢弃一段时间的 FAPI 消息,以允许 L1 恢复
nvIPC pcap 采集改进 - 引入了在 nvIPC pcap 采集中添加过滤器 (小区 ID,消息 ID 级别) 的功能
控制台上的回溯输出 - Aerial 在崩溃时在控制台上打印回溯信息
Aerial cuMAC: CUDA 加速 MAC 调度器
DRL MCS 选择模块
预训练神经网络位于 aerial_sdk/cuMAC/testVectors 下
基于 TensorRT 的推理
64TR MU-MIMO 调度器
基于 SRS SNR 估计的 UE 排序算法
基于 SRS 信道系数估计的 UE 分组算法
非周期 SRS 资源管理器
与 MU-MIMO UE 排序算法结合使用
使用基于 GPU 的 TDL 信道模型的 4T4R 系统仿真
改进的 type-0 和 type-1 4T4R 调度器的算法和 CUDA 实现
pyAerial: Aerial cuPHY 的 Python 接口
CSI-RS 传输管道
RSRP 以及均衡器前后 SINR 估计
载波频率偏移和定时提前估计
CRC 校验
OFDM 衰落信道仿真
支持 PUSCH 接收机管道及其组件的多个 UE 组
改进的 PUSCH 接收机管道及其组件的 API
24-2.1 版本的新增功能
以下是 Aerial CUDA 加速 RAN 24-2.1 版本中的新增功能
Aerial cuPHY: CUDA 加速的内联 PHY
64T64R Massive MIMO
100 MHz DL 最大组合 16 层 + UL 最大组合 8 层 + SRS
64T64R SRS + 动态 + 静态波束赋形权重
支持多个动态 UE 组
支持灵活的 PRG 大小和 PRB 数量
支持来自 L2 的 SRS 缓冲区索引
支持非 2^n 层
在拆分 C-Plane 部分时使用不同的 section ID
CSIRS + PDSCH 和其他信道组合的 FH 消息传递
支持 GH200+BF3 作为 RU 模拟器平台
24-2 版本的新增功能
以下是 Aerial CUDA 加速 RAN 24-2 版本中的新增功能
Aerial cuPHY: CUDA 加速的内联 PHY
MGX Grace Hopper 多小区容量,具有电信级流量模型
20 个峰值负载的 4T4R @ 100MHz
容量也已通过更具挑战性的流量模型验证
S-slot 中的 PUSCH 和 PDCCH 符号
L1-L2 接口增强
PDSCH 和 PDCCH 的单独 FAPI 请求时间线
Aerial cuMAC: CUDA 加速 MAC 调度器
cuMAC-Sch
4T4R CUDA 实现已完成
cuMAC-CP
4T4R 实现 (功能性 - 早期访问)
Aerial cuBB/E2E: 系统级 / 端到端验证
空中 (OTA) 验证
CBRS O-RU
8 个 UE OTA,在 > 8 小时内 6 个 UE/TTI
RedHat-OCP
多小区容量已在 MGX (GH200+BF3) 上验证
O-RAN 前传
16 位定点 IQ 样本已通过 E2E 验证 (Keysight eLSU)
同步双端口 FH 功能 (8 个峰值小区;每个端口 4 个)
L2 集成
每个 L1 的多 L2 容器实例已通过 E2E 验证
pyAerial: Aerial cuPHY 的 Python 接口
TensorRT 推理引擎
使用 pyAerial 验证神经 PUSCH 接收机的 Jupyter notebook 示例
LDPC API 改进
向 LDPC 解码器添加了软输出
LS 信道估计
对 Grace Hopper 的有限支持
将 pyAerial 与 Aerial Data Lakes 一起运行