与基线工具的比较
许多用户希望将 NVIDIA Parabricks 软件生成的输出与其他标准工具进行比较。我们建议使用以下方法来比较 Parabricks 软件和相应的非加速软件生成的输出。
GATK4 基于 QNAME、FLAG、RNAME、POS、MAPQ、MRNM/RNEXT、MPOS/PNEXT 和 ISIZE 对 BAM 文件进行排序。如果两个不同的 BAM 文件的所有这些字段都相同,则在排序目的上它们被认为是相等的。因此,要比较两个排序的 BAM 文件,请使用 BamUtil diff 工具来比较这些字段:。
$ bam diff --in1 mark_dups_gpu.bam --in2 mark_dups_cpu.bam --noCigar --isize --flag --mate --mapQual
此比较的输出应无差异。
Parabricks 和 GATK4 生成的文件应完全相同。以下命令应该没有输出
$ diff -w recal_gpu.txt recal_cpu.txt
要比较 VCF 文件,请使用 GATK Concordance 工具来获取 SNP 和 INDEL 的灵敏度和特异性。当运行以下命令时,变异准确性结果将存储在 out.txt
中。
$ gatk Concordance \
--evaluation result_gpu.vcf \
--truth result_cpu.vcf \
--summary out.txt