概述#

RFdiffusion (RoseTTAFold Diffusion) 是一种强大的深度学习模型,旨在生成新颖的蛋白质结构和复合物。

该网络采用基于扩散的方法逐步优化蛋白质结构,从而能够创建多样化和高质量的 3D 蛋白质模型。

神经网络的输入是以各种格式(包括 PDB 格式的部分蛋白质结构)存在的一组约束或规范,输出是以 PDB 格式生成的 3D 蛋白质结构。

RFdiffusion 是您可以应用于生物科学和药物发现任务的众多 NIM 之一。NIM 使您可以轻松地将模型链接在一起,以开发完整的计算机药物发现流程。

例如,您可以将 RFdiffusion NIM 用作生成结合物 3D 结构的第一步,然后使用 ProteinMPNN NIM 来确定可能折叠成此 3D 结构的氨基酸序列。

注意

有关该模型的更详细描述,请参阅已发表的 RFdiffusion 论文[1]

NIM 的优势#

一般来说,NIM 为自托管 AI 应用程序提供了一种简单且易于部署的途径。NIM 为系统管理员和开发人员提供的两个主要优势是

  • 提高生产力:NIM 使开发人员能够通过提供一种标准化的方式将 AI 功能添加到他们的应用程序中,从而在几分钟而不是几周内快速构建生成式 AI 应用程序。

  • 简化部署:NIM 提供容器,这些容器可以轻松部署在各种平台(包括云、数据中心或工作站)上,从而方便开发人员测试和部署他们的应用程序。

在蛋白质设计和药物开发的背景下,这些优势可以

  • 加速先导化合物优化:研究人员可以使用 NIM 通过快速生成和测试多种分子结构来加速先导化合物优化过程,从而使他们能够更有效地识别潜在的先导化合物。

  • 简化数据分析:研究人员可以使用 NIM 来分析药物发现过程中生成的大型数据集,例如分子动力学模拟或高通量筛选数据,以识别可以为新药开发提供信息的模式和趋势。

  • 改善协作:NIM 可以通过提供用于共享和集成 AI 模型的标准化平台来促进研究人员之间的协作,使团队能够更有效和高效地协同工作。

  • 增强预测建模:研究人员可以使用 NIM 开发和部署预测模型,这些模型可以准确预测分子的特性和行为,例如它们的结合亲和力或毒性,使他们能够在药物开发过程中做出更明智的决策。