模型详情#
模型架构#
架构类型: 卷积神经网络 (CNN) 网络架构: 3D UNet + 注意力模块
输入#
num_output_samples#
输入类型: 整数
输入格式: 单个整数值
输入参数: 必需输入,指示模型将生成的合成图像的数量。
body_region#
输入类型: 列表
输入格式: 字符串数组
输入参数: 必需输入,指示生成的 CT 将聚焦的身体区域
选项: [“头部”, “胸部”, “胸廓”, “腹部”, “盆腔”, “下部”]
anatomy_list#
输入类型: 列表
输入格式: 字符串数组
输入参数: 可选的 127 个解剖类别的列表(在附加信息部分列出)
output_size#
输入类型: 列表
输入格式: 3 个整数的数组
输入参数: 可选的 3 个数字的列表,指示 CT 图像的 x、y 和 z 尺寸。
x 轴和 y 轴: 128, 256, 384, 512
z 轴: 128, 256, 384, 512, 640, 768
spacing#
输入类型: 列表
输入格式: 3 个浮点数的数组
输入参数: 可选的 3 个浮点数的列表,指示 CT 图像的间距
每个元素必须在以下范围内: 0.5 到 5.0
controllable_anatomy_size#
输入类型: 列表
输入格式: 元组数组 (String, Float)
输入参数: 最多 10 种不同解剖结构的可选元组列表。每个元组由一个 (organ_name, size_value) 对组成。
organ_name 选项: [“肝脏”, “胆囊”, “胃”, “胰腺”, “结肠”, “肺肿瘤”, “骨病灶”, “肝肿瘤”, “原发性结肠癌”, “胰腺肿瘤”]
size_value 范围: 0.0 到 1.0,或 -1 (表示不存在/删除此器官)
输出#
输出类型: 图像
输出格式: (Neuroimaging Informatics Technology Initiative) NIfTI, (Digital Imaging and Communications in - Medicine) DICOM, 和 (Nearly Raw Raster Data) Nrrd
输出参数: 三维 (3D)
输出描述: 合成 CT 图像,尺寸高达 512x512x768,间距在 0.5mm 到 5.0mm 之间,反映了指定的可控解剖结构尺寸。如果输入参数中请求,还会提供一个额外的 NIfTI 文件,其中包含 anatomy_list 的相应标签图。
软件集成#
运行时引擎: MONAI Core v.1.4
支持的硬件微架构兼容性
NVIDIA Ampere
NVIDIA Hopper
[首选/支持的] 操作系统
Linux
推理#
引擎: Triton
测试硬件: A100, H100 (对于 512x512x512 图像,至少需要 80GB 内存)
支持的解剖结构#
您可以在 MAISI label_dict.json 中找到用于分割的完整支持解剖结构列表。
伦理考量#
NVIDIA 认为可信赖的 AI 是共同的责任,我们已建立政策和实践,以支持各种 AI 应用的开发。当根据我们的服务条款下载或使用时,开发者应与其内部模型团队合作,以确保此模型满足相关行业和用例的要求,并解决未预见的产品误用问题。请在此处报告安全漏洞或 NVIDIA AI 关注问题:此处。
许可#
NIM 容器和模型受 NVIDIA 软件和模型评估许可协议 管辖。