Clara Parabricks v4.4.0

genotypegvcf

此工具将 g.vcf 格式的变异位点检出转换为 VCF 格式。

此工具应用加速的 GATK GenotypeGVCFs 进行联合基因分型,将 g.vcf 格式转换为常规 VCF 格式。它利用使用 -ERC GVCF 标志生成的 HaplotypeCaller 基因型似然性,对一个或多个(多样本)g.vcf 文件进行联合基因分型。

有关所有可用选项的详细列表,请参阅 genotypegvcf 参考 部分。

复制
已复制!
            

# This command assumes all the inputs are in INPUT_DIR and all the outputs go to OUTPUT_DIR. docker run --rm --gpus all --volume INPUT_DIR:/workdir --volume OUTPUT_DIR:/outputdir \ --workdir /workdir \ nvcr.io/nvidia/clara/clara-parabricks:4.4.0-1 \ pbrun genotypegvcf \ --ref /workdir/${REFERENCE_FILE} \ --in-gvcf /workdir/${INPUT_GVCF_FILE} \ --out-vcf /outputdir/${OUTPUT_VCF}

复制
已复制!
            

$ gatk GenotypeGVCFs \ -R <INPUT_DIR>/${REFERENCE_FILE} \ -V <INPUT_DIR>/${INPUT_GVCF_FILE} \ -O <OUTPUT_DIR>/${OUTPUT_VCF}

将 GVCF 转换为 VCF。

输入/输出文件选项

--ref REF

参考文件路径。(默认值:None)

此选项为必选项。

--in-gvcf IN_GVCF

输入要转换为 VCF 的 g.vcf 或 g.vcf.gz 文件。必需。(默认值:None)

此选项为必选项。

--out-vcf OUT_VCF

输出 VCF 文件的路径。(默认值:None)

此选项为必选项。

此工具特有的选项

(无)

性能选项

--num-threads NUM_THREADS

工作线程数。(默认值:4)

常用选项

--logfile LOGFILE

日志文件路径。如果未指定,消息将仅写入标准错误输出。(默认值:None)

--tmp-dir TMP_DIR

临时文件将存储在的目录的完整路径。

--with-petagene-dir WITH_PETAGENE_DIR

PetaGene 安装目录的完整路径。默认情况下,这应安装在 /opt/petagene。使用此选项还需要通过设置 LD_PRELOAD 环境变量来预加载 PetaLink 库。可以选择设置用于数据和凭据的 PETASUITE_REFPATH 和 PGCLOUD_CREDPATH 环境变量(默认值:None)

--keep-tmp

完成时不删除存储临时文件的目录。

--no-seccomp-override

不覆盖 docker 的 seccomp 选项(默认值:None)。

--version

查看兼容的软件版本。

上一篇 fq2bam_meth
下一篇 germline (GATK Germline Pipeline)
© 版权所有 2025,Nvidia。 最后更新于 2025 年 1 月 13 日。