使用 BMC#

DGX Station A100 配备基板管理控制器 (BMC),用于监控和控制系统上的各种硬件设备、系统传感器和其他参数。

注意

在您可以登录 BMC 之前,请参阅安全性中的安全信息。

BMC 具有其自身的管理网络端口和 VGA 显示端口。

_images/real-panel-displayport-vga-port.png

DGX Station A100 具有两个显示设备:DGX 显示适配器和 BMC 显示适配器。根据 BIOS 设置,您可以将 OS X 显示定向到任一适配器。可以调整这些设置以使用 BIOS 中列出的三种模式之一。nvidia-conf-xconfig.service 管理 X-Windowing 系统的此功能。

以下是显示选择模式列表

自动:自动配置 X-windowing 系统以使用系统中当前存在的任何兼容显示适配器。默认选择是使用 NVIDIA DGX 显示适配器 (mini-DP),但是如果此适配器不存在,则将选择板载 BMC 显示适配器(15 针 VGA)。如果由于任何原因未检测到任何一个适配器,则该服务将退出而不进行设置。

板载:配置 X-windowing 系统以专门使用板载 BMC 显示适配器。如果由于任何原因 BMC 显示适配器不存在,它将回退到使用 NVIDIA DGX 显示适配器(如果存在),否则该服务将退出而不进行任何设置。

外部:配置 X-windowing 系统以专门使用 DGX 显示适配器。BMC 显示适配器被禁用。如果由于任何原因 NVIDIA DGX 显示适配器不存在,则该服务将退出而不进行任何设置。

有关更多信息,请参阅将 DGX Station A100 用作无显示器服务器

了解 BMC 控件#

在 BMC 仪表板中,BMC 主页面上的左侧导航窗格包含主要控件。

以下是控件列表

BMC 导航控件#

控件

描述

仪表板

显示有关设备状态的总体信息。

传感器

提供系统传感器的状态和读数,例如 SSD、PSU、电压、CPU 温度、DIMM 温度和风扇速度。

系统清单

显示以下系统模块的清单信息

系统、处理器、内存控制器、基板、电源、散热、PCIE 设备、PCIE 功能和存储。

FRU 信息

提供机箱、主板和产品信息。

GPU 信息

提供系统中所有 GPU 的基本信息,包括 GUID、VBIOS 版本、InfoROM 版本和每个 GPU 的已停用页面数量。

日志和报告

查看 IPMI 事件日志以及系统、审核、视频和 POST 代码日志,如果适用,还可以下载和擦除它们。

设置

配置以下设置

捕获的 BSOD、日期和时间、外部用户服务、KVM 鼠标设置、日志设置、媒体重定向设置、网络设置、PAM 顺序设置、平台事件过滤器、服务、SMTP 设置、SSL 设置、系统防火墙、用户管理、视频录制和 IPMI 接口。

远程控制

打开 KVM 启动页面,用于远程访问 DGX A100 控制台。

电源控制

执行以下电源操作

开机、关机、电源循环、硬复位和 ACPI/关机

维护

执行以下维护任务

备份配置、固件映像位置、固件更新、BIOS 更新、保留配置、PSU 更新、FPGA 更新、Retimer 更新、背板更新、保留配置、恢复配置、恢复出厂默认设置和重置

退出

退出 BMC Web UI。

为 BMC 配置静态 IP 地址#

以下是关于如何为 BMC 配置静态 IP 地址的一些信息。

使用 ipmitool 配置 BMC 静态 IP 地址#

以下是关于如何从 Ubuntu 命令行设置 BMC 的静态 IP 地址的一些信息。

注意

如果您无法远程访问 DGX Station A100,请将显示器(1440x900 或更低分辨率)和键盘直接连接到 DGX Station A100。

要查看当前设置,请输入以下命令。

$ sudo ipmitool lan print 1
  1. 要为 BMC 设置静态 IP 地址,请完成以下步骤

    1. 将 IP 地址源设置为 static

      $ sudo ipmitool lan set 1 ipsrc static
      
    2. 设置适当的地址信息。

      • 要设置 IP 地址,请在Station IP 地址中输入以下内容,并将斜体文本替换为您的信息。

        $ sudo ipmitool lan set 1 ipaddr<my-ip-address>
        
      • 要设置子网掩码,请输入以下内容,并将斜体文本替换为您的信息。

        $ sudo ipmitool lan set 1 netmask<my-netmask-address>
        
      • 要设置默认网关 IP,请在路由器 IP 地址中输入以下内容,并将斜体文本替换为您的信息。

        $ sudo ipmitool lan set 1 defgw ipaddr<my-default-gateway-ip-address>
        

使用系统 BIOS 配置 BMC 静态 IP 地址#

本节介绍当您无法远程访问 DGX Station A100 时,如何为 BMC 设置静态 IP 地址。此过程涉及在系统启动期间设置 BMC IP 地址。

  1. 将键盘和显示器(最大分辨率 1440 x 900)连接到 DGX A100 系统,然后打开 DGX Station A100 的电源。

  2. 当您看到 SBIOS 版本屏幕时,要进入 BIOS 设置实用程序屏幕,请按 DelF2

  3. 在 BIOS 设置实用程序屏幕上,在服务器管理选项卡上,滚动到 BMC 网络配置,然后按 Enter

  4. 滚动到 配置地址源,然后按 Enter

  5. 配置地址源 对话框中,选择 静态,然后按 Enter。

  6. 通过完成以下每个地址的步骤,根据需要设置 Station IP 地址、子网掩码和路由器 IP 地址的地址

    1. 滚动到特定项目,然后按 Enter

    2. 在对话框中输入适当的信息,然后按 Enter

    3. 完成更改后,按 F4 保存并退出。

登录 BMC#

以下是登录 BMC 的步骤。

  1. 要登录 BMC,请在浏览器中输入配置的 IP 地址,然后按 Enter

  2. 输入您之前配置的 BMC 用户名和密码。

    _images/new-bmc-login-screen.png

    警告

    如果您输入错误密码 5 次或更多次,则会显示登录失败消息,并且您将被锁定。有关何时可以重新登录的更多信息,请参阅输入错误密码后登录

  3. 单击登录

    以下是 BMC 仪表板的示例

    _images/bmc-dashboard.png

更改默认 BMC 密码#

当您完成以下任务之一时

  • 在 BMC Web UI 中,单击恢复出厂默认设置,并且不要单击保存以保留设置。

  • 运行 $ sudo ipmitool raw 0x32 0x66 命令。

admin 和 Administrator 用户的密码将恢复为以下默认密码

  • admin(对于 admin 角色)

  • superuser(对于 Administrator 角色)

系统上的所有其他用户将被删除。

我们强烈建议您更改密码。如果您不更改密码,任何人都可以使用默认密码并登录 BMC。

输入错误密码后登录#

在您至少五 (5) 次输入错误的登录 BMC 密码后,您将被锁定。以下是关于您如何再次登录 BMC 的一些重要信息。

在至少 5 次输入错误密码后,您将被锁定 10 分钟,然后才能再次尝试登录。在这 10 分钟内,如果您再次输入错误密码,则锁定时间将延长。

锁定时间按以下方式计算

10 分钟 * (失败 计数 - 5 容错)

例如,如果您输入错误密码 7 次,则必须等待 20 分钟 (10 * (7 5) 才能再次登录。

重要提示

当前锁定时间的开始时间是从您输入的最新错误密码计算的,而不是从第一次锁定时间计算的。

如果您需要立即解锁用户,则必须重置 BMC。

常用 BMC 任务#

本节提供有关您可以在 BMC 中完成的最常见任务的信息。

配置 BMC 登录凭据#

以下是关于如何从 BMC 添加或删除用户的一些信息。

  1. 登录 BMC。

  2. 在左侧导航窗格中,单击设置

  3. 单击用户管理卡。

    _images/bmc-dashboard-settings-options.png
  4. 单击帮助图标,获取有关如何配置用户和创建密码的更多信息。

    重要提示

    密码长度必须至少为 13 个字符。

  5. 注销并使用新凭据重新登录。

使用远程控制#

以下是关于如何启动远程 KVM 并访问 DGX A100 Station 控制台的信息。

重要提示

如果您选择媒体加速复选框,则与媒体重定向相关的进程将比其他进程具有更高的优先级。

_images/media-boost-checkbox.png
  1. 在左侧导航栏中,单击远程控制

  2. 单击启动 KVM

设置 Active Directory 或 LDAP/E-Directory#

以下是关于在 BMC 中设置 Active Directory 或 LDAP/E-Directory 的一些信息。

  1. 在左侧导航窗格中,单击设置

  2. 单击外部用户服务

    _images/set-up-ad-ldap.png
  3. 单击以下选项之一,然后按照说明操作

    _images/ad-ldap-options.png

配置平台事件过滤器#

以下是关于如何配置事件过滤器的一些信息。

  1. 在左侧导航窗格中,单击设置 > 平台事件过滤器。

    “事件过滤器”页面显示所有已配置的事件过滤器和可用插槽。您可以在此页面上修改或添加新的事件过滤器条目。

    • 要查看可用的已配置和未配置插槽,请单击页面左上角的全部

    • 要查看可用的已配置插槽,请单击页面左上角的已配置

    • 要查看可用的未配置插槽,请单击页面左上角的未配置

    • 要从列表中删除事件过滤器,请单击 x 图标。

上传或生成 SSL 证书#

以下是关于如何上传或生成 SSL 证书的一些信息。

您可以通过以下方式之一设置新的 SSL 证书

  • 生成自签名 SSL。

  • 上传 SSL,例如,使用受信任的 CA 签名证书。

在左侧导航窗格中,单击设置 > 外部用户服务

_images/ssl-certs.png

查看 SSL 证书#

您可以显示您生成或上传的 SSL 证书。

在“SSL 设置”页面上,单击查看 SSL 证书

_images/view-ssl-cert.png

“查看 SSL 证书”页面显示有关上传的 SSL 证书的以下基本信息

  • 证书版本、序列号、算法和公钥

  • 颁发者信息

  • 有效日期范围

  • 颁发给信息

生成 SSL 证书#

以下是生成 SSL 证书的步骤。

  1. 在“SSL 设置”页面中,单击生成 SSL 证书

    _images/generate-ssl-cert.png
  2. 输入下表中所述的适当信息

    生成 SSL 证书的字段#

    项目

    描述

    通用名称 (CN)

    要为其生成证书的通用名称。

    • 最大长度为 64 个字母数字字符。

    • 不允许使用特殊字符 #$

    组织 (O)

    为其生成证书的组织的名称。

    • 最大长度为 64 个字母数字字符。

    • 不允许使用特殊字符 #$

    组织单位 (OU)

    为其生成证书的总体组织部门单位名称。

    • 最大长度为 64 个字母数字字符。

    • 不允许使用特殊字符 #$

    城市或地区 (L)

    必填)组织所在的城市或地区

    • 最大长度为 64 个字母数字字符。

    • 不允许使用特殊字符 #$

    • 最大长度为 64 个字母数字字符。

    • 不允许使用特殊字符 #$

    州或省 (ST)

    必填)组织所在的州或省

    • 最大长度为 64 个字母数字字符。

    • 不允许使用特殊字符 #$

    国家/地区 (C)

    组织所在国家/地区的国家/地区代码。

    • 仅允许两个字符。

    • 不允许使用特殊字符。

    电子邮件地址

    必填)组织的电子邮件地址

    有效期至

    • 证书的有效期。

    • 输入 1 到 3650(天)的范围

    密钥长度

    证书的密钥长度位值(例如,2048 位)

  3. 要生成证书,请单击保存

上传 SSL 证书#

在 BMC 中,您可以上传您的 SSL 证书。

确保证书和密钥满足以下要求

  • SSL 证书和密钥都必须使用 .pem 文件扩展名。

  • 私钥不得加密。

  • SSL 证书和密钥的大小都必须小于 3584 位。

  • SSL 证书必须是当前的(未过期)。

  1. 在“SSL 设置”页面上,单击上传 SSL 证书

    _images/upload-ssl-cert.png
  2. 单击新证书文件夹图标,浏览找到适当的文件,然后选择它。

  3. 单击新私钥文件夹图标,浏览并找到适当的文件,然后选择它。

  4. 单击保存