附录 C:故障排除
本节包含链接和示例,说明在哪里探索和发帖以查找解决方案或帮助。
在进行故障排除或提交错误报告之前,请查看发行说明,了解有关当前版本的已知问题和潜在解决方法的信息。
NVIDIA 论坛是解决部署虚拟化环境时可能遇到的许多问题的非常全面的来源。请首先在 NVIDIA 论坛上搜索,论坛位于此处。
您还可以浏览 NVIDIA 企业服务知识库,查找支持文章和链接。
请记住,并非您部署中的所有问题都可以在 NVIDIA vGPU 论坛中得到解答。您可能还需要参考硬件供应商、虚拟机监控程序和应用程序本身的论坛。以下是一些需要浏览的关键论坛示例
在提交错误报告或请求支持帮助时,务必包含有关环境的信息,以便技术人员可以帮助您解决问题。NVIDIA 在 vib 安装包中包含 nvidia-bug-report.sh 脚本,用于收集和打包这些关键信息。该脚本收集以下信息
Citrix 版本
X.Org 日志和配置
PCI 信息
CPU 信息
GPU 信息
PLX 设备的 esxcfg 信息
GPU 设备的 esxcfg 信息
VIB 信息
来自 vmkernel.log 的 NVRM 消息
系统 dmesg 输出
哪些虚拟机配置了 vGPU 或 vSGA
NSMI 输出
运行此脚本时
您可以使用 -o 或 –output 开关后跟输出文件名来指定错误报告的输出位置。如果您未指定输出目录,脚本会将错误报告写入当前目录。
如果您未指定文件名,脚本将使用默认名称 nvidia-bug-report.log.gz。
如果所选目录已包含错误报告文件,则脚本会在生成新的 nvidia-bugreport.log.gz 文件之前,将现有报告文件的名称更改为 nvidia-bug-report.log.old.gz。
要收集错误报告,请发出命令
nvidia-bug-report.sh
系统在收集过程中显示以下消息
nvidia-bug-report.sh will now collect information about your system and create the file 'nvidia-bug-report.log.gz' in the current directory. It may take several seconds to run. Sometimes, it may hang trying to capture data generated dynamically by the vSphere kernel and/or the NVIDIA kernel module. While the bug report log file will be incomplete if this happens, it may still contain enough data to diagnose your problem.
向 NVIDIA 报告问题时,请务必包含 nvidia-bug-report.log.gz 日志文件。