首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Snakemake古代标签与通配符

Snakemake古代标签与通配符
EN

Stack Overflow用户
提问于 2020-09-03 13:18:12
回答 1查看 249关注 0票数 1

我有几个SRA文件,我从NCBI网站下载。现在,我想将它们添加到我的snakemake工作流中。但是,如果没有可用的prefetch,我希望保留下载它们的能力。我有个简单的规则,

代码语言:javascript
复制
BASE = "/path/to/working/folder"

rule all:
    input: [f"{BASE}/fastq/SRR000001.sra_1.fastq", f"{BASE}/fastq/SRR000001.sra_2.fastq"]
    shell:
        "echo Finished"

rule get_sra:
    input: ancient("config/config.yaml")
    output:"{BASE_FOLDER}/sra/{SSR_ID}.sra"
    shell:
         "prefetch -p {wildcards.SSR_ID} --output-file {output} "

rule get_fastq:
    input: expand("{folder}/sra/{srr}.sra", folder=BASE, srr="{SRR_ID}")
    output:
          expand("{folder}/fastq/{srr}.sra_{i}.fastq", folder=BASE,
                 srr="{SRR_ID}", i=[1, 2])
    shell:
         "fasterq-dump {input} --outdir {BASE}/fastq"

如果我使用上述规则,我的工作流程将重新创建我的SRA文件,因为他们的时间戳将是旧的。但是,我不想再次从服务器下载完整的SRA文件,并使用已经下载的文件。

为此,我尝试使用古老的标记。但是我不能在任何通配符中使用这个标签。

代码语言:javascript
复制
input: ancient("{BASE_FOLDER}/sra/{SSR_ID}.sra")

上述规则给出的错误为

无法从输出文件中确定输入文件中的通配符:

这个问题有什么解决办法吗?当我使用expand时,这也不起作用。

EN

回答 1

Stack Overflow用户

发布于 2020-09-04 16:27:29

问题是,在大括号中指定的所有内容实际上都是通配符。您可能有三个不同的用例,您可以使用花括号:

  • expand函子
  • F-弦
  • 通配符

在前两种情况下(展开和f-字符串),结果是一个完全指定的字符串,根本没有通配符。如果你有这样的东西:

代码语言:javascript
复制
rule dummy:
    input: "{wildcard}.input"
    output: expand("{wildcard}.output", wildcard=["1", "2"])

其结果很简单:

代码语言:javascript
复制
rule dummy:
    input: "{wildcard}.input"
    output: ["1.output", "2.output"]

如您所见,输出部分中根本没有通配符,因此输入无法确定其通配符的值。

典型的解决方案是将此规则分为两条规则:

代码语言:javascript
复制
rule all:
    input: expand("{wildcard}.output", wildcard=["1", "2"])

rule do_some_work:
    input: "{wildcard}.input"
    output: "{wildcard}.output"

但是,请注意,我在{wildcard}中称为rule all:的东西本身并不是通配符,而只是expand函数的本地上下文中任意选择的名称。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/63724513

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档