prepon
为 PON 文件生成索引。这是在 mutectcaller 中使用 “--pon” 选项的先决条件。
prepon
要求输入 .vcf.gz
文件的头部包含 Contig 字段,以便在执行开始时进行内存分配。此字段应包含染色体名称和长度
##contig=<ID=chr1,length=248956422>
##contig=<ID=chr2,length=242193529>
##contig=<ID=chr3,length=198295559>
...
如果您的输入 .vcf.gz
文件不包含这些值,请在运行 prepon
之前运行此命令来更新头部
$ bcftools reheader --fai YOUR_REFERENCE_FILE.fa.fai INPUT_PON.vcf.gz > UPDATED_PON.vcf.gz
有关所有可用选项的详细列表,请参阅 prepon 参考部分。
# This command assumes all the inputs are in INPUT_DIR and all the outputs go to OUTPUT_DIR.
docker run --rm --gpus all --volume INPUT_DIR:/workdir --volume OUTPUT_DIR:/outputdir \
--workdir /workdir \
nvcr.io/nvidia/clara/clara-parabricks:4.4.0-1 \
pbrun prepon \
--in-pon-file /workdir/${INPUT_PON_VCF}
为 PON 文件构建索引;这是 mutect pon 的先决条件
输入/输出文件选项
- --in-pon-file IN_PON_FILE
-
输入 PON 文件的路径,格式为 vcf.gz,并带有 tabix 索引。(默认值:None)
此选项为必填项。
此工具特有的选项
(无)
常用选项
- --logfile LOGFILE
-
日志文件的路径。如果未指定,消息将仅写入标准错误输出。(默认值:None)
- --tmp-dir TMP_DIR
-
临时文件存储目录的完整路径。
- --with-petagene-dir WITH_PETAGENE_DIR
-
PetaGene 安装目录的完整路径。默认情况下,这应安装在 /opt/petagene。使用此选项还需要通过设置 LD_PRELOAD 环境变量预加载 PetaLink 库。可以选择设置用于数据和凭据的 PETASUITE_REFPATH 和 PGCLOUD_CREDPATH 环境变量(默认值:None)
- --keep-tmp
-
完成时不要删除存储临时文件的目录。
- --no-seccomp-override
-
不要覆盖 docker 的 seccomp 选项(默认值:None)。
- --version
-
查看兼容的软件版本。
GPU 选项
- --num-gpus NUM_GPUS
-
运行中使用的 GPU 数量。将使用 GPU 0..(NUM_GPUS-1)。