概述#
描述#
NVIDIA MAISI(用于合成影像的医疗 AI)是一种先进的三维 (3D) 潜在扩散模型,旨在生成具有或不具有解剖注释的高质量合成 CT 图像。此 AI 模型擅长数据增强和创建逼真的医学影像数据,以补充因隐私问题或罕见疾病而受限的数据集。它还可以通过生成多样化且逼真的训练数据,显著提高其他医学影像 AI 模型的性能。
MAISI 提供以下几个关键功能
生成高达 512 × 512 × 768 体素的高分辨率 3D CT 图像
支持 0.5 毫米至 5.0 毫米的可变体素尺寸
能够注释多达 127 个解剖类别,包括器官和肿瘤
允许对 10 个特定类别进行可控的解剖尺寸调整
生成成对的分割掩膜
通过提供这些功能,MAISI 是研究人员推进医疗保健领域 AI 应用的宝贵工具。但是,务必注意,此模型仅用于研究目的,不得用于临床用途。
MAISI 工作流程#
下图描述了 MAISI 的推理工作流程。它首先通过使用训练过的扩散模型应用多个去噪步骤,从随机噪声生成潜在特征。然后,它使用训练过的自动编码器将去噪后的潜在特征解码为图像。
MAISI NIM 的优势#
NVIDIA NIM for MAISI 简化了 MAISI 模型的部署,为系统管理员和开发人员提供了多项优势
提高生产力:MAISI NIM 使开发人员能够通过提供一种标准化的方式将 AI 功能添加到其应用程序中,从而在几分钟而不是几周内快速构建生成式 AI 应用程序。
简化部署:MAISI NIM 提供可在各种平台(包括云、数据中心或工作站)上轻松部署的容器,使开发人员可以方便地测试和部署其应用程序。
可扩展性:容器化方法确保部署可以根据应用程序的需求进行扩展,无论是小型研究项目还是大规模部署。
一致性:使用 NIM 确保环境在不同的部署平台之间保持一致,从而减少与环境相关的问题的发生。
通过利用 MAISI NIM,开发人员可以更多地关注创新,减少对部署复杂性的关注,从而确保更顺畅、更高效的工作流程。
您有责任确保您对 NVIDIA AI 基础模型的使用符合所有适用法律。
使用条款#
通过使用此模型,您同意许可的条款和条件。
参考文献#
[1] Rombach, Robin, et al. “高分辨率图像合成与潜在扩散模型。” IEEE/CVF 计算机视觉与模式识别会议论文集. 2022. https://openaccess.thecvf.com/content/CVPR2022/papers/Rombach_High-Resolution_Image_Synthesis_With_Latent_Diffusion_Models_CVPR_2022_paper.pdf
[2] Lvmin Zhang, Anyi Rao, Maneesh Agrawala; “向文本到图像扩散模型添加条件控制。” IEEE/CVF 国际计算机视觉会议 (ICCV) 论文集,2023,第 3836-3847 页。 https://openaccess.thecvf.com/content/ICCV2023/papers/Zhang_Adding_Conditional_Control_to_Text-to-Image_Diffusion_Models_ICCV_2023_paper.pdf