Clara Parabricks v4.4.0

bqsr

此工具生成碱基质量分数重新校准报告,该报告可由 applybqsr 工具应用,以重新校准 BAM 文件中的质量分数。 这作为推荐的 GATK 最佳实践的一部分应用,以最大程度地提高变异识别的准确性。

有关所有可用选项的详细列表,请参阅 bqsr 参考部分。

复制
已复制!
            

# This command assumes all the inputs are in INPUT_DIR and all the outputs go to OUTPUT_DIR. docker run --rm --gpus all --volume INPUT_DIR:/workdir --volume OUTPUT_DIR:/outputdir \ --workdir /workdir \ nvcr.io/nvidia/clara/clara-parabricks:4.4.0-1 \ pbrun bqsr \ --ref /workdir/${REFERENCE_FILE} \ --in-bam /workdir/${INPUT_BAM} \ --knownSites /workdir/${KNOWN_SITES_FILE} \ --out-recal-file /outputdir/${INPUT_RECAL_FILE} \

以下命令是 Parabricks 上述命令的 GATK4 对等命令。 此命令的输出将与上述命令的输出相同。

复制
已复制!
            

$ gatk BaseRecalibrator \ --java-options -Xmx30g \ --input <INPUT_DIR>/${INPUT_BAM} \ --output <OUTPUT_DIR>/${INPUT_RECAL_FILE} \ --known-sites <INPUT_DIR>/${KNOWN_SITES_FILE} \ --reference <INPUT_DIR>/${REFERENCE_FILE}

在 BAM 文件上运行 BQSR 以生成 BQSR 报告。

输入/输出文件选项

--ref REF

参考文件的路径。(默认值:无)

选项是必需的。

--in-bam IN_BAM

BAM 文件的路径。(默认值:无)

选项是必需的。

--knownSites KNOWNSITES

已知插入缺失文件的路径。文件必须为 vcf.gz 格式。此选项可以多次使用。(默认值:无)

选项是必需的。

--interval-file INTERVAL_FILE

区间文件的路径,格式为以下之一:Picard 样式 (.interval_list 或 .picard)、GATK 样式 (.list 或 .intervals) 或 BED 文件 (.bed)。此选项可以多次使用。(默认值:无)

--out-recal-file OUT_RECAL_FILE

输出报告文件。(默认值:无)

选项是必需的。

工具选项

-L INTERVAL, --interval INTERVAL

从输入读取调用 BQSR 的区间。所有区间将具有 100 的填充以获取读取记录,并且重叠的区间将被合并。区间文件应使用 --interval-file 选项传递。此选项可以多次使用 (例如 "-L chr1 -L chr2:10000 -L chr3:20000+ -L chr4:10000-20000")。(默认值:无)

-ip INTERVAL_PADDING, --interval-padding INTERVAL_PADDING

要添加到您包含的每个区间的填充量(以碱基对为单位)。(默认值:无)

常用选项

--logfile LOGFILE

日志文件的路径。 如果未指定,消息将仅写入标准错误输出。(默认值:无)

--tmp-dir TMP_DIR

临时文件将存储在的目录的完整路径。

--with-petagene-dir WITH_PETAGENE_DIR

PetaGene 安装目录的完整路径。 默认情况下,这应该已安装在 /opt/petagene。 使用此选项还需要通过设置 LD_PRELOAD 环境变量来预加载 PetaLink 库。 可选地设置用于数据和凭据的 PETASUITE_REFPATH 和 PGCLOUD_CREDPATH 环境变量 (默认值:无)

--keep-tmp

完成后不要删除存储临时文件的目录。

--no-seccomp-override

不要覆盖 docker 的 seccomp 选项 (默认值:无)。

--version

查看兼容的软件版本。

GPU 选项

--num-gpus NUM_GPUS

运行要使用的 GPU 数量。将使用 GPU 0..(NUM_GPUS-1)。

上一个 bamsort
下一个 collectmultiplemetrics
© 版权所有 2025,Nvidia。 上次更新于 2025 年 1 月 13 日。