Clara Parabricks v4.4.0

文档组织方式

  • 本页简要概述了 NVIDIA Parabricks:它是什么、它能做什么以及如何使用它。

  • 新增功能? 介绍了自上一版本以来的更改:新工具、现有工具的改进和错误修复。

  • NVIDIA Parabricks 入门 重点介绍了设置软件的所有步骤,包括要求、示例以及针对性能进行优化

  • 软件概述 更详细地讨论了 Parabricks 工具、如何在 WDL 或 Nextflow 环境中使用 Parabricks 以及它与同类 CPU 软件版本的兼容性。

  • 最佳性能 提供了有关使用 Parabricks 软件包实现最佳性能的技巧。

  • 教程 将引导您使用示例数据集完成 Parabricks 的一次使用。这些步骤将使您熟悉该软件,并引导您完成一个可重现的示例。它从参考(FASTA)和 FASTQ 文件开始,生成 BAM 文件,对 BAM 文件执行变异调用,最后生成 VCF 文件。

  • 操作指南 探讨了更大、更复杂的任务,检查了更广泛的选项、工具和工作流程。由于使用了更大的数据集,可能需要功能更强大的硬件平台(更多 GPU、更多内存等)。

  • 工具参考 包含每个工具的参考文档,按类别和工具名称的字母顺序组织。它还告诉用户如何将 Parabricks 的输出与基线工具的输出进行比较。本节还包括引用 Parabricks 的出版物列表、常见问题解答列表以及有关获取更多帮助和信息的指针

  • Grace Hopper 超级芯片 包含在新 Grace Hopper 超级芯片上运行 Parabricks 的指南和参考资料。

什么是 Parabricks?

Parabricks 是一套免费软件,用于对下一代测序(NGS)DNA 和 RNA 数据执行二级分析。它以惊人的速度和低成本交付结果。Parabricks 可以在大约 10 分钟内分析 30 倍 WGS(全人类基因组)数据,而不是其他方法的 30 小时。其输出与常用软件匹配,使其能够相当简单地验证输出的准确性。

为什么使用 Parabricks?

在底层,Parabricks 通过与 GPU 的紧密集成来实现这种性能,GPU 在执行数据并行计算方面比传统的基于 CPU 的解决方案更有效。Parabricks 由 GPU 计算和深度学习专家从头构建,他们希望开发最快、最有效的二级分析中常用基因组算法的实现。

Parabricks 开发者页面 了解更多信息。

如何获取 Parabricks?

Parabricks 在 NGC 上作为公共容器免费提供,可在本地或任何云服务平台和提供商上使用。您可以在我们的 网页 上了解有关 Parabricks 的更多信息,包括如何通过 NVIDIA AI Enterprise 购买 Parabricks 的企业支持,该支持具有保证的响应时间、优先安全通知以及 NVIDIA AI 专家的访问权限。DGX Cloud 上的用户可以免费使用 NVIDIA AI Enterprise。

请参阅以下 云启动指南,了解有关在云中使用 Parabricks 的更多信息

软件概述

Parabricks 是一套用于基因组分析的软件包。它在基因组学中常见分析任务(包括种系和体细胞分析)的吞吐量时间方面实现了重大改进。Parabricks 软件的核心是其与 GPU 的紧密集成,GPU 接收原始数据并根据用户的要求对其进行转换。

Parabricks 支持以下显示的工具


pb_tools.png

此外,Parabricks 工具套件还提供了许多变异调用流程,每个流程都是几个单独工具的组合,将原本是多步骤的过程组合到一个工具中。这些流程是


pb_pipelines.png

Parabricks 已在 Dell、HPE、IBM 和 NVIDIA 服务器上经过 Amazon Web Services、Google Cloud、Oracle Cloud Infrastructure 和 Microsoft Azure 的测试。

如何获得帮助

  1. 如需技术支持、更新的用户指南和其他 Clara Parabricks 文档,请参阅 NVIDIA 页面

  2. 大多数常见问题解答都可以在 开发者论坛 上找到。

© 版权所有 2025,Nvidia。 上次更新时间:2025 年 1 月 13 日。