数据中心网络部署
本节介绍网络管理的三种常见数据中心部署类型
- 带外管理(推荐)
- 带内管理
- 具有高可用性的服务器集群
NetQ 在第 3 层运行,并且可以在第 2 层桥接和第 3 层路由的环境中运行。NVIDIA 建议尽可能使用第 3 层路由环境。
带外管理部署
NVIDIA 建议在带外 (OOB) 管理网络上部署 NetQ,以将网络管理流量与标准网络数据流量分开。
物理*网络*硬件包括
- Spine 交换机:聚合和分发数据;也称为聚合交换机、行尾 (EOR) 交换机或分配交换机
- Leaf 交换机:服务器连接到网络的位置;也称为机架顶部 (TOR) 交换机或接入交换机
- 服务器主机:托管应用程序和通过网络提供给用户的数据
- 出口交换机:数据中心外部连接发生的位置,也称为边界 leaf 或服务 leaf
- 边缘服务器(可选):防火墙是分界点,对等互连可以通过出口交换机层发生到互联网 (PE) 设备
- 互联网设备:提供商边缘 (PE) 设备在第 3 层与网络结构通信的位置
下图显示了数据中心的 Clos 网络结构设计的示例,该设计使用叠加在顶部的 OOB 管理网络,NetQ 驻留在其中。物理连接显示为灰色线条,将 Spine01 连接到四个 leaf 设备和两个出口设备;Spine02 连接到相同的 leaf 设备和出口设备。Leaf01 和 Leaf02 通过对等链路相互连接,并充当 Server01 和 Server02 的 MLAG 对,Leaf03 和 Leaf04 也为 Server03 和 Server04 执行相同操作。边缘连接到两个出口设备,互联网节点连接到 Exit01。

物理*管理*硬件包括
- OOB 管理交换机:聚合交换机,通过与每个节点上的 NetQ 代理通信来连接到所有网络设备
- NetQ 平台:托管遥测软件、数据库和用户界面
这些交换机通过虚拟网络叠加连接到每个物理网络设备,如下所示。

带内管理部署
虽然不推荐,但您可以在数据网络中实施 NetQ。在这种情况下,没有叠加,并且往返于 NetQ 代理和 NetQ 平台的所有流量都与您的常规网络流量一起遍历数据路径。Clos 网络中交换机的作用相同,只是 NetQ 平台执行 OOB 管理交换机执行的聚合功能。如果您的网络出现故障,您可能无法访问 NetQ 平台进行故障排除。某些功能(例如生命周期管理)需要其他配置用于带内部署。

服务器集群部署
NetQ 支持服务器集群部署,适用于喜欢具有更高可扩展性和可用性解决方案的用户;如果一台服务器发生故障,通过其他服务器,NetQ 收集的数据仍然可用。在此配置中,部署了三台 NetQ 服务器——一台主服务器和两台工作服务器(或副本)。NetQ 代理将数据发送到所有三台服务器,这样如果主服务器发生故障,其中一个副本将自动成为主服务器并继续存储遥测数据。本地和云 (OPTA) 集群部署都通过虚拟 IP 地址支持高可用性,该虚拟 IP 地址分配在与主节点和工作节点相同的子网中。这允许在主节点发生故障时进行 UI 访问。
以下示例基于 OOB 管理配置,并进行了修改以支持 NetQ 的更高可扩展性。
