模型详情#

模型架构#

架构类型: 卷积神经网络 (CNN) 网络架构: 3D UNet + 注意力模块

输入#

num_output_samples#

  • 输入类型: 整数

  • 输入格式: 单个整数值

  • 输入参数: 必需输入,指示模型将生成的合成图像的数量。

body_region#

  • 输入类型: 列表

  • 输入格式: 字符串数组

  • 输入参数: 必需输入,指示生成的 CT 将聚焦的身体区域

  • 选项: [“头部”, “胸部”, “胸廓”, “腹部”, “盆腔”, “下部”]

anatomy_list#

  • 输入类型: 列表

  • 输入格式: 字符串数组

  • 输入参数: 可选的 127 个解剖类别的列表(在附加信息部分列出)

output_size#

  • 输入类型: 列表

  • 输入格式: 3 个整数的数组

  • 输入参数: 可选的 3 个数字的列表,指示 CT 图像的 x、y 和 z 尺寸。

    • x 轴和 y 轴: 128, 256, 384, 512

    • z 轴: 128, 256, 384, 512, 640, 768

spacing#

  • 输入类型: 列表

  • 输入格式: 3 个浮点数的数组

  • 输入参数: 可选的 3 个浮点数的列表,指示 CT 图像的间距

  • 每个元素必须在以下范围内: 0.5 到 5.0

controllable_anatomy_size#

  • 输入类型: 列表

  • 输入格式: 元组数组 (String, Float)

  • 输入参数: 最多 10 种不同解剖结构的可选元组列表。每个元组由一个 (organ_name, size_value) 对组成。

    • organ_name 选项: [“肝脏”, “胆囊”, “胃”, “胰腺”, “结肠”, “肺肿瘤”, “骨病灶”, “肝肿瘤”, “原发性结肠癌”, “胰腺肿瘤”]

    • size_value 范围: 0.0 到 1.0,或 -1 (表示不存在/删除此器官)

输出#

  • 输出类型: 图像

  • 输出格式: (Neuroimaging Informatics Technology Initiative) NIfTI, (Digital Imaging and Communications in - Medicine) DICOM, 和 (Nearly Raw Raster Data) Nrrd

  • 输出参数: 三维 (3D)

  • 输出描述: 合成 CT 图像,尺寸高达 512x512x768,间距在 0.5mm 到 5.0mm 之间,反映了指定的可控解剖结构尺寸。如果输入参数中请求,还会提供一个额外的 NIfTI 文件,其中包含 anatomy_list 的相应标签图。

软件集成#

运行时引擎: MONAI Core v.1.4

支持的硬件微架构兼容性

  • NVIDIA Ampere

  • NVIDIA Hopper

[首选/支持的] 操作系统

  • Linux

推理#

引擎: Triton
测试硬件: A100, H100 (对于 512x512x512 图像,至少需要 80GB 内存)

支持的解剖结构#

您可以在 MAISI label_dict.json 中找到用于分割的完整支持解剖结构列表。

伦理考量#

NVIDIA 认为可信赖的 AI 是共同的责任,我们已建立政策和实践,以支持各种 AI 应用的开发。当根据我们的服务条款下载或使用时,开发者应与其内部模型团队合作,以确保此模型满足相关行业和用例的要求,并解决未预见的产品误用问题。请在此处报告安全漏洞或 NVIDIA AI 关注问题:此处

许可#

NIM 容器和模型受 NVIDIA 软件和模型评估许可协议 管辖。