文档组织方式
本页简要概述了 NVIDIA Parabricks:它是什么、它能做什么以及如何使用它。
新增功能? 介绍了自上一版本以来的更改:新工具、现有工具的改进和错误修复。
NVIDIA Parabricks 入门 重点介绍了设置软件的所有步骤,包括要求、示例以及针对性能进行优化
软件概述 更详细地讨论了 Parabricks 工具、如何在 WDL 或 Nextflow 环境中使用 Parabricks 以及它与同类 CPU 软件版本的兼容性。
最佳性能 提供了有关使用 Parabricks 软件包实现最佳性能的技巧。
教程 将引导您使用示例数据集完成 Parabricks 的一次使用。这些步骤将使您熟悉该软件,并引导您完成一个可重现的示例。它从参考(FASTA)和 FASTQ 文件开始,生成 BAM 文件,对 BAM 文件执行变异调用,最后生成 VCF 文件。
操作指南 探讨了更大、更复杂的任务,检查了更广泛的选项、工具和工作流程。由于使用了更大的数据集,可能需要功能更强大的硬件平台(更多 GPU、更多内存等)。
工具参考 包含每个工具的参考文档,按类别和工具名称的字母顺序组织。它还告诉用户如何将 Parabricks 的输出与基线工具的输出进行比较。本节还包括引用 Parabricks 的出版物列表、常见问题解答列表以及有关获取更多帮助和信息的指针
Grace Hopper 超级芯片 包含在新 Grace Hopper 超级芯片上运行 Parabricks 的指南和参考资料。
什么是 Parabricks?
Parabricks 是一套免费软件,用于对下一代测序(NGS)DNA 和 RNA 数据执行二级分析。它以惊人的速度和低成本交付结果。Parabricks 可以在大约 10 分钟内分析 30 倍 WGS(全人类基因组)数据,而不是其他方法的 30 小时。其输出与常用软件匹配,使其能够相当简单地验证输出的准确性。
为什么使用 Parabricks?
在底层,Parabricks 通过与 GPU 的紧密集成来实现这种性能,GPU 在执行数据并行计算方面比传统的基于 CPU 的解决方案更有效。Parabricks 由 GPU 计算和深度学习专家从头构建,他们希望开发最快、最有效的二级分析中常用基因组算法的实现。
在 Parabricks 开发者页面 了解更多信息。
如何获取 Parabricks?
Parabricks 在 NGC 上作为公共容器免费提供,可在本地或任何云服务平台和提供商上使用。您可以在我们的 网页 上了解有关 Parabricks 的更多信息,包括如何通过 NVIDIA AI Enterprise 购买 Parabricks 的企业支持,该支持具有保证的响应时间、优先安全通知以及 NVIDIA AI 专家的访问权限。DGX Cloud 上的用户可以免费使用 NVIDIA AI Enterprise。
请参阅以下 云启动指南,了解有关在云中使用 Parabricks 的更多信息
软件概述
Parabricks 是一套用于基因组分析的软件包。它在基因组学中常见分析任务(包括种系和体细胞分析)的吞吐量时间方面实现了重大改进。Parabricks 软件的核心是其与 GPU 的紧密集成,GPU 接收原始数据并根据用户的要求对其进行转换。
Parabricks 支持以下显示的工具

此外,Parabricks 工具套件还提供了许多变异调用流程,每个流程都是几个单独工具的组合,将原本是多步骤的过程组合到一个工具中。这些流程是

Parabricks 已在 Dell、HPE、IBM 和 NVIDIA 服务器上经过 Amazon Web Services、Google Cloud、Oracle Cloud Infrastructure 和 Microsoft Azure 的测试。