Setting Up Dependencies and Conda Environment for trio_call_phase_pipeline

public 10mo ago 0 bookmarks

View Workflow

trio_call_phase_pipeline — View Workflow

Help improve this workflow!

This workflow has been published but could be further improved with some additional meta data:

Keyword(s) in categories input, output, operation

You can help improve this workflow by suggesting the addition or removal of keywords, suggest changes and report issues, or request to become a maintainer of the Workflow .

/panguangze/trio_call_phase_pipeline

install:

dysgu https://github.com/panguangze/dysgu.git master branch

pedHap https://github.com/panguangze/pedHapCpp.git main branch

conda create -c conda-forge -c bioconda --name snakemake snakemake snakedeploy

conda activate

Code Snippets

    wrapper:
        "master/bio/{}".format(config["bwa_mem"]["wrapper"])


rule samtools_merge:
    input:
        lambda w: expand(
            "results/mapped/{sample}-{unit}.sorted.bam",
            sample=w,
            unit=samples.loc[w].unit,
        ),
    output:
        bam="results/mapped/{sample}.bam",
        idx="results/mapped/{sample}.bam.csi",
    log:
        "results/logs/samtools_merge/{sample}.log",
    params:
        config["samtools_merge"]["params"] + " --write-index",  # optional additional parameters as string
    threads: config["samtools_merge"]["threads"]  # Samtools takes additional threads through its option -@
    wrapper:
        "master/bio/samtools/merge"

SnakeMake From line 17 of rules/mapping.smk

wrapper:
    "master/bio/bcftools/concat"

SnakeMake From line 12 of rules/phase.smk

wrapper:
    "master/bio/bcftools/index"

SnakeMake From line 27 of rules/phase.smk

run:
    shell(
        "mkdir -p {params.lst_dir} && "
        "{params.bin_path} "
        "{params.ngs_params} "
        "--bam {input.bams[0]} "
        "--VCF {input.vcf} "
        "--idx 0 "
        "--out {params.lst_dir}/0.lst && sort -k3 -n {params.lst_dir}/0.lst > {params.lst_dir}/0.s.lst"
    )
    shell(
        "{params.bin_path} "
        "{params.ngs_params} "
        "--bam {input.bams[1]} "
        "--VCF {input.vcf} "
        "--idx 1 "
        "--out {params.lst_dir}/1.lst && sort -k3 -n {params.lst_dir}/1.lst > {params.lst_dir}/1.s.lst"
    )
    shell(
        "{params.bin_path} "
        "{params.ngs_params} "
        "--bam {input.bams[2]} "
        "--VCF {input.vcf} "
        "--idx 2 "
        "--out {params.lst_dir}/2.lst && sort -k3 -n {params.lst_dir}/2.lst > {params.lst_dir}/2.s.lst"
    )

SnakeMake From line 50 of rules/phase.smk

run:
    shell(
        "mkdir -p {output.phased_dir} && "
        "{params.bin_path} "
        "{params.ngs_params} "
        "-v {input.vcf} "
        "-f {params.lst_dir}/0.s.lst "
        "-o  {output.phased_dir}/0.spec.vcf "
        "--idx 0  && {params.bgzip_path} {output.phased_dir}/0.spec.vcf" 
    )
    shell(
        "{params.bin_path} "
        "{params.ngs_params} "
        "-v {input.vcf} "
        "-f {params.lst_dir}/1.s.lst "
        "-o  {output.phased_dir}/1.spec.vcf "
        "--idx 1  && {params.bgzip_path} {output.phased_dir}/1.spec.vcf" 
    )
    shell(
        "{params.bin_path} "
        "{params.ngs_params} "
        "-v {input.vcf} "
        "-f {params.lst_dir}/2.s.lst "
        "-o  {output.phased_dir}/2.spec.vcf "
        "--idx 2  && {params.bgzip_path} {output.phased_dir}/2.spec.vcf" 
    )

SnakeMake From line 91 of rules/phase.smk

run:
    shell("{params.tabix_path} -f {input.phased_dir}/0.spec.vcf.gz")
    shell("{params.tabix_path} -f {input.phased_dir}/1.spec.vcf.gz")
    shell("{params.tabix_path} -f {input.phased_dir}/2.spec.vcf.gz")
    shell("touch {output}")

SnakeMake From line 125 of rules/phase.smk

shell:
    "{params.bin_path} "
    "{params.run_params} "
    "--vcf {params.vcf} "
    "--out {output.vcf} "
    "--homo_recom {output.recom} "

SnakeMake From line 142 of rules/phase.smk

wrapper:
    "master/bio/fastp"

SnakeMake fastp From line 17 of rules/trimming.smk

wrapper:
    "master/bio/fastp"

SnakeMake fastp From line 37 of rules/trimming.smk

shell:
    "run_deeptrio "
    "--model_type WGS "
    "--ref {params.ref} "
    "--reads_child {input.bams[0]} "
    "--reads_parent1 {input.bams[1]} "
    "--reads_parent2 {input.bams[2]} "
    "--output_vcf_child {output.out_dir}/{params.sample_names[0]}.vcf.gz "
    "--output_vcf_parent1 {output.out_dir}/{params.sample_names[1]}.vcf.gz "
    "--output_vcf_parent2 {output.out_dir}/{params.sample_names[2]}.vcf.gz "
    "--sample_name_child {params.sample_names[0]} "
    "--sample_name_parent1 {params.sample_names[1]} "
    "--sample_name_parent2 {params.sample_names[2]} "
    "--num_shards {threads}  "
    "--intermediate_results_dir {output}/intermediate_results_dir "
    "--output_gvcf_child {output.out_dir}/{params.sample_names[0]}.g.vcf.gz "
    "--output_gvcf_parent1 {output.out_dir}/{params.sample_names[1]}.g.vcf.gz "
    "--output_gvcf_parent2 {output.out_dir}/{params.sample_names[2]}.g.vcf.gz "

SnakeMake From line 30 of rules/trio_calling_snp.smk

shell:
    "glnexus_cli "
    "--config DeepVariantWGS "
    "--dir {output.scratch} "
    "--threads {threads} "
    "{input.gvcfs}/{params.sample_names[0]}.g.vcf.gz "
    "{input.gvcfs}/{params.sample_names[1]}.g.vcf.gz "
    "{input.gvcfs}/{params.sample_names[2]}.g.vcf.gz "
    "2> {log} "
    "| bcftools view - "
    "| bgzip -c "
    "> {output.vcf} "

SnakeMake BCFtools GLnexus From line 67 of rules/trio_calling_snp.smk

wrapper:
    "master/bio/bcftools/index"

SnakeMake From line 93 of rules/trio_calling_snp.smk

wrapper:
    "master/bio/bcftools/view"

SnakeMake From line 106 of rules/trio_calling_snp.smk

shell:
    "{params.bin_path} run "
    "-p {threads} "
    "{params.run_params} "
    "{params.ref} "
    "{output.tmp_dir} "
    "{input.bam} "
    "-o {output.out_vcf}"

SnakeMake From line 22 of rules/trio_calling_sv.smk

shell:
    "{params.bin_path} merge "
    "{params.merge_trio_params} "
    "{input.vcfs} "
    "-o {output.out_vcf}"

SnakeMake From line 46 of rules/trio_calling_sv.smk

wrapper:
    "master/bio/bcftools/filter"

SnakeMake From line 63 of rules/trio_calling_sv.smk

wrapper:
    "master/bio/bcftools/index"

SnakeMake From line 78 of rules/trio_calling_sv.smk

__author__ = "Johannes Köster"
__copyright__ = "Copyright 2016, Johannes Köster"
__email__ = "[email protected]"
__license__ = "MIT"


from snakemake.shell import shell
from snakemake_wrapper_utils.bcftools import get_bcftools_opts


bcftools_opts = get_bcftools_opts(snakemake, parse_ref=False, parse_memory=False)
extra = snakemake.params.get("extra", "")
log = snakemake.log_fmt_shell(stdout=True, stderr=True)


shell("bcftools concat {bcftools_opts} {extra} {snakemake.input.calls} {log}")

Python Snakemake BCFtools snakemake-wrapper-utils From line 1 of concat/wrapper.py

__author__ = "Patrik Smeds"
__copyright__ = "Copyright 2021, Patrik Smeds"
__email__ = "[email protected]"
__license__ = "MIT"


from snakemake.shell import shell
from snakemake_wrapper_utils.bcftools import get_bcftools_opts


bcftools_opts = get_bcftools_opts(
    snakemake, parse_ref=False, parse_samples=False, parse_memory=False
)
extra = snakemake.params.get("extra", "")
log = snakemake.log_fmt_shell(stdout=False, stderr=True)
filter = snakemake.params.get("filter", "")


if len(snakemake.output) > 1:
    raise Exception("Only one output file expected, got: " + str(len(snakemake.output)))


shell(
    "bcftools filter"
    " {bcftools_opts}"
    " {filter}"
    " {extra}"
    " {snakemake.input[0]}"
    " {log}"
)

Python Snakemake BCFtools snakemake-wrapper-utils From line 1 of filter/wrapper.py

__author__ = "Johannes Köster"
__copyright__ = "Copyright 2016, Johannes Köster"
__email__ = "[email protected]"
__license__ = "MIT"


from snakemake.shell import shell
from snakemake_wrapper_utils.bcftools import get_bcftools_opts


bcftools_opts = get_bcftools_opts(
    snakemake, parse_ref=False, parse_output_format=False, parse_memory=False
)
extra = snakemake.params.get("extra", "")
log = snakemake.log_fmt_shell(stdout=True, stderr=True)


if "--tbi" in extra or "--csi" in extra:
    raise ValueError(
        "You have specified index format (`--tbi/--csi`) in `params.extra`; this is automatically infered from the first output file."
    )

if snakemake.output[0].endswith(".tbi"):
    extra += " --tbi"
elif snakemake.output[0].endswith(".csi"):
    extra += " --csi"
else:
    raise ValueError("invalid index file format ('.tbi', '.csi').")


shell("bcftools index {bcftools_opts} {extra} {snakemake.input[0]} {log}")

Python Snakemake BCFtools snakemake-wrapper-utils From line 1 of index/wrapper.py

__author__ = "Johannes Köster"
__copyright__ = "Copyright 2016, Johannes Köster"
__email__ = "[email protected]"
__license__ = "MIT"


from snakemake.shell import shell
from snakemake_wrapper_utils.bcftools import get_bcftools_opts

bcftools_opts = get_bcftools_opts(snakemake, parse_ref=False, parse_memory=False)
extra = snakemake.params.get("extra", "")
log = snakemake.log_fmt_shell(stdout=True, stderr=True)

shell("bcftools view {bcftools_opts} {extra} {snakemake.input[0]} {log}")

Python Snakemake BCFtools snakemake-wrapper-utils From line 1 of view/wrapper.py

__author__ = "Sebastian Kurscheid"
__copyright__ = "Copyright 2019, Sebastian Kurscheid"
__email__ = "[email protected]"
__license__ = "MIT"

from snakemake.shell import shell
import re

extra = snakemake.params.get("extra", "")
adapters = snakemake.params.get("adapters", "")
log = snakemake.log_fmt_shell(stdout=True, stderr=True)


# Assert input
n = len(snakemake.input.sample)
assert (
    n == 1 or n == 2
), "input->sample must have 1 (single-end) or 2 (paired-end) elements."


# Input files
if n == 1:
    reads = "--in1 {}".format(snakemake.input.sample)
else:
    reads = "--in1 {} --in2 {}".format(*snakemake.input.sample)


# Output files
trimmed_paths = snakemake.output.get("trimmed", None)
if trimmed_paths:
    if n == 1:
        trimmed = "--out1 {}".format(snakemake.output.trimmed)
    else:
        trimmed = "--out1 {} --out2 {}".format(*snakemake.output.trimmed)

        # Output unpaired files
        unpaired = snakemake.output.get("unpaired", None)
        if unpaired:
            trimmed += f" --unpaired1 {unpaired} --unpaired2 {unpaired}"
        else:
            unpaired1 = snakemake.output.get("unpaired1", None)
            if unpaired1:
                trimmed += f" --unpaired1 {unpaired1}"
            unpaired2 = snakemake.output.get("unpaired2", None)
            if unpaired2:
                trimmed += f" --unpaired2 {unpaired2}"

        # Output merged PE reads
        merged = snakemake.output.get("merged", None)
        if merged:
            if not re.search(r"--merge\b", extra):
                raise ValueError(
                    "output.merged specified but '--merge' option missing from params.extra"
                )
            trimmed += f" --merged_out {merged}"
else:
    trimmed = ""


# Output failed reads
failed = snakemake.output.get("failed", None)
if failed:
    trimmed += f" --failed_out {failed}"


# Stats
html = "--html {}".format(snakemake.output.html)
json = "--json {}".format(snakemake.output.json)


shell(
    "(fastp --thread {snakemake.threads} "
    "{extra} "
    "{adapters} "
    "{reads} "
    "{trimmed} "
    "{json} "
    "{html} ) {log}"
)

Python Snakemake JSON From line 1 of fastp/wrapper.py

__author__ = "Johannes Köster"
__copyright__ = "Copyright 2016, Johannes Köster"
__email__ = "[email protected]"
__license__ = "MIT"


from snakemake.shell import shell
from snakemake_wrapper_utils.samtools import get_samtools_opts

samtools_opts = get_samtools_opts(snakemake)
extra = snakemake.params.get("extra", "")
log = snakemake.log_fmt_shell(stdout=True, stderr=True)

shell("samtools merge {samtools_opts} {extra} {snakemake.input} {log}")