使用 BMC#
DGX Station A100 配备基板管理控制器 (BMC),用于监控和控制系统上的各种硬件设备、系统传感器和其他参数。
注意
在您可以登录 BMC 之前,请参阅安全性中的安全信息。
BMC 具有其自身的管理网络端口和 VGA 显示端口。

DGX Station A100 具有两个显示设备:DGX 显示适配器和 BMC 显示适配器。根据 BIOS 设置,您可以将 OS X 显示定向到任一适配器。可以调整这些设置以使用 BIOS 中列出的三种模式之一。nvidia-conf-xconfig.service 管理 X-Windowing 系统的此功能。
以下是显示选择模式列表
自动:自动配置 X-windowing 系统以使用系统中当前存在的任何兼容显示适配器。默认选择是使用 NVIDIA DGX 显示适配器 (mini-DP),但是如果此适配器不存在,则将选择板载 BMC 显示适配器(15 针 VGA)。如果由于任何原因未检测到任何一个适配器,则该服务将退出而不进行设置。
板载:配置 X-windowing 系统以专门使用板载 BMC 显示适配器。如果由于任何原因 BMC 显示适配器不存在,它将回退到使用 NVIDIA DGX 显示适配器(如果存在),否则该服务将退出而不进行任何设置。
外部:配置 X-windowing 系统以专门使用 DGX 显示适配器。BMC 显示适配器被禁用。如果由于任何原因 NVIDIA DGX 显示适配器不存在,则该服务将退出而不进行任何设置。
有关更多信息,请参阅将 DGX Station A100 用作无显示器服务器。
了解 BMC 控件#
在 BMC 仪表板中,BMC 主页面上的左侧导航窗格包含主要控件。
以下是控件列表
控件 |
描述 |
---|---|
仪表板 |
显示有关设备状态的总体信息。 |
传感器 |
提供系统传感器的状态和读数,例如 SSD、PSU、电压、CPU 温度、DIMM 温度和风扇速度。 |
系统清单 |
显示以下系统模块的清单信息 系统、处理器、内存控制器、基板、电源、散热、PCIE 设备、PCIE 功能和存储。 |
FRU 信息 |
提供机箱、主板和产品信息。 |
GPU 信息 |
提供系统中所有 GPU 的基本信息,包括 GUID、VBIOS 版本、InfoROM 版本和每个 GPU 的已停用页面数量。 |
日志和报告 |
查看 IPMI 事件日志以及系统、审核、视频和 POST 代码日志,如果适用,还可以下载和擦除它们。 |
设置 |
配置以下设置 捕获的 BSOD、日期和时间、外部用户服务、KVM 鼠标设置、日志设置、媒体重定向设置、网络设置、PAM 顺序设置、平台事件过滤器、服务、SMTP 设置、SSL 设置、系统防火墙、用户管理、视频录制和 IPMI 接口。 |
远程控制 |
打开 KVM 启动页面,用于远程访问 DGX A100 控制台。 |
电源控制 |
执行以下电源操作 开机、关机、电源循环、硬复位和 ACPI/关机 |
维护 |
执行以下维护任务 备份配置、固件映像位置、固件更新、BIOS 更新、保留配置、PSU 更新、FPGA 更新、Retimer 更新、背板更新、保留配置、恢复配置、恢复出厂默认设置和重置 |
退出 |
退出 BMC Web UI。 |
为 BMC 配置静态 IP 地址#
以下是关于如何为 BMC 配置静态 IP 地址的一些信息。
使用 ipmitool 配置 BMC 静态 IP 地址#
以下是关于如何从 Ubuntu 命令行设置 BMC 的静态 IP 地址的一些信息。
注意
如果您无法远程访问 DGX Station A100,请将显示器(1440x900 或更低分辨率)和键盘直接连接到 DGX Station A100。
要查看当前设置,请输入以下命令。
$ sudo ipmitool lan print 1
要为 BMC 设置静态 IP 地址,请完成以下步骤
将 IP 地址源设置为
static
。$ sudo ipmitool lan set 1 ipsrc static
设置适当的地址信息。
要设置 IP 地址,请在Station IP 地址中输入以下内容,并将斜体文本替换为您的信息。
$ sudo ipmitool lan set 1 ipaddr<my-ip-address>
要设置子网掩码,请输入以下内容,并将斜体文本替换为您的信息。
$ sudo ipmitool lan set 1 netmask<my-netmask-address>
要设置默认网关 IP,请在路由器 IP 地址中输入以下内容,并将斜体文本替换为您的信息。
$ sudo ipmitool lan set 1 defgw ipaddr<my-default-gateway-ip-address>
使用系统 BIOS 配置 BMC 静态 IP 地址#
本节介绍当您无法远程访问 DGX Station A100 时,如何为 BMC 设置静态 IP 地址。此过程涉及在系统启动期间设置 BMC IP 地址。
将键盘和显示器(最大分辨率 1440 x 900)连接到 DGX A100 系统,然后打开 DGX Station A100 的电源。
当您看到 SBIOS 版本屏幕时,要进入 BIOS 设置实用程序屏幕,请按 Del 或 F2。
在 BIOS 设置实用程序屏幕上,在服务器管理选项卡上,滚动到 BMC 网络配置,然后按 Enter。
滚动到 配置地址源,然后按 Enter。
在 配置地址源 对话框中,选择 静态,然后按 Enter。
通过完成以下每个地址的步骤,根据需要设置 Station IP 地址、子网掩码和路由器 IP 地址的地址
滚动到特定项目,然后按 Enter。
在对话框中输入适当的信息,然后按 Enter。
完成更改后,按 F4 保存并退出。
登录 BMC#
以下是登录 BMC 的步骤。
要登录 BMC,请在浏览器中输入配置的 IP 地址,然后按 Enter。
输入您之前配置的 BMC 用户名和密码。
警告
如果您输入错误密码 5 次或更多次,则会显示登录失败消息,并且您将被锁定。有关何时可以重新登录的更多信息,请参阅输入错误密码后登录。
单击登录。
以下是 BMC 仪表板的示例
更改默认 BMC 密码#
当您完成以下任务之一时
在 BMC Web UI 中,单击恢复出厂默认设置,并且不要单击保存以保留设置。
运行
$ sudo ipmitool raw 0x32 0x66
命令。
admin 和 Administrator 用户的密码将恢复为以下默认密码
admin
(对于 admin 角色)superuser
(对于 Administrator 角色)
系统上的所有其他用户将被删除。
我们强烈建议您更改密码。如果您不更改密码,任何人都可以使用默认密码并登录 BMC。
输入错误密码后登录#
在您至少五 (5) 次输入错误的登录 BMC 密码后,您将被锁定。以下是关于您如何再次登录 BMC 的一些重要信息。
在至少 5 次输入错误密码后,您将被锁定 10 分钟,然后才能再次尝试登录。在这 10 分钟内,如果您再次输入错误密码,则锁定时间将延长。
锁定时间按以下方式计算
10 分钟 * (失败 计数 - 5 容错)
例如,如果您输入错误密码 7 次,则必须等待 20 分钟 (10 * (7 – 5)
才能再次登录。
重要提示
当前锁定时间的开始时间是从您输入的最新错误密码计算的,而不是从第一次锁定时间计算的。
如果您需要立即解锁用户,则必须重置 BMC。
常用 BMC 任务#
本节提供有关您可以在 BMC 中完成的最常见任务的信息。
配置 BMC 登录凭据#
以下是关于如何从 BMC 添加或删除用户的一些信息。
登录 BMC。
在左侧导航窗格中,单击设置。
单击用户管理卡。
单击帮助图标,获取有关如何配置用户和创建密码的更多信息。
重要提示
密码长度必须至少为 13 个字符。
注销并使用新凭据重新登录。
使用远程控制#
以下是关于如何启动远程 KVM 并访问 DGX A100 Station 控制台的信息。
重要提示
如果您选择媒体加速复选框,则与媒体重定向相关的进程将比其他进程具有更高的优先级。

在左侧导航栏中,单击远程控制。
单击启动 KVM。
设置 Active Directory 或 LDAP/E-Directory#
以下是关于在 BMC 中设置 Active Directory 或 LDAP/E-Directory 的一些信息。
在左侧导航窗格中,单击设置。
单击外部用户服务。
单击以下选项之一,然后按照说明操作
配置平台事件过滤器#
以下是关于如何配置事件过滤器的一些信息。
在左侧导航窗格中,单击设置 > 平台事件过滤器。
“事件过滤器”页面显示所有已配置的事件过滤器和可用插槽。您可以在此页面上修改或添加新的事件过滤器条目。
要查看可用的已配置和未配置插槽,请单击页面左上角的全部。
要查看可用的已配置插槽,请单击页面左上角的已配置。
要查看可用的未配置插槽,请单击页面左上角的未配置。
要从列表中删除事件过滤器,请单击 x 图标。
上传或生成 SSL 证书#
以下是关于如何上传或生成 SSL 证书的一些信息。
您可以通过以下方式之一设置新的 SSL 证书
生成自签名 SSL。
上传 SSL,例如,使用受信任的 CA 签名证书。
在左侧导航窗格中,单击设置 > 外部用户服务。

查看 SSL 证书#
您可以显示您生成或上传的 SSL 证书。
在“SSL 设置”页面上,单击查看 SSL 证书。

“查看 SSL 证书”页面显示有关上传的 SSL 证书的以下基本信息
证书版本、序列号、算法和公钥
颁发者信息
有效日期范围
颁发给信息
生成 SSL 证书#
以下是生成 SSL 证书的步骤。
在“SSL 设置”页面中,单击生成 SSL 证书。
输入下表中所述的适当信息
生成 SSL 证书的字段# 项目
描述
通用名称 (CN)
要为其生成证书的通用名称。
最大长度为 64 个字母数字字符。
不允许使用特殊字符
#
和$
。
组织 (O)
为其生成证书的组织的名称。
最大长度为 64 个字母数字字符。
不允许使用特殊字符
#
和$
。
组织单位 (OU)
为其生成证书的总体组织部门单位名称。
最大长度为 64 个字母数字字符。
不允许使用特殊字符
#
和$
。
城市或地区 (L)
(必填)组织所在的城市或地区
最大长度为 64 个字母数字字符。
不允许使用特殊字符
#
和$
。最大长度为 64 个字母数字字符。
不允许使用特殊字符
#
和$
。
州或省 (ST)
(必填)组织所在的州或省
最大长度为 64 个字母数字字符。
不允许使用特殊字符
#
和$
。
国家/地区 (C)
组织所在国家/地区的国家/地区代码。
仅允许两个字符。
不允许使用特殊字符。
电子邮件地址
(必填)组织的电子邮件地址
有效期至
证书的有效期。
输入 1 到 3650(天)的范围
密钥长度
证书的密钥长度位值(例如,2048 位)
要生成证书,请单击保存。
上传 SSL 证书#
在 BMC 中,您可以上传您的 SSL 证书。
确保证书和密钥满足以下要求
SSL 证书和密钥都必须使用 .pem 文件扩展名。
私钥不得加密。
SSL 证书和密钥的大小都必须小于 3584 位。
SSL 证书必须是当前的(未过期)。
在“SSL 设置”页面上,单击上传 SSL 证书。
单击新证书文件夹图标,浏览找到适当的文件,然后选择它。
单击新私钥文件夹图标,浏览并找到适当的文件,然后选择它。
单击保存。