我有几个SRA文件,我从NCBI网站下载。现在,我想将它们添加到我的snakemake工作流中。但是,如果没有可用的prefetch,我希望保留下载它们的能力。我有个简单的规则,
BASE = "/path/to/working/folder"
rule all:
input: [f"{BASE}/fastq/SRR000001.sra_1.fastq", f"{BASE}/fastq/SRR000001.sra_2.fastq"]
shell:
"echo Finished"
rule get_sra:
input: ancient("config/config.yaml")
output:"{BASE_FOLDER}/sra/{SSR_ID}.sra"
shell:
"prefetch -p {wildcards.SSR_ID} --output-file {output} "
rule get_fastq:
input: expand("{folder}/sra/{srr}.sra", folder=BASE, srr="{SRR_ID}")
output:
expand("{folder}/fastq/{srr}.sra_{i}.fastq", folder=BASE,
srr="{SRR_ID}", i=[1, 2])
shell:
"fasterq-dump {input} --outdir {BASE}/fastq"如果我使用上述规则,我的工作流程将重新创建我的SRA文件,因为他们的时间戳将是旧的。但是,我不想再次从服务器下载完整的SRA文件,并使用已经下载的文件。
为此,我尝试使用古老的标记。但是我不能在任何通配符中使用这个标签。
input: ancient("{BASE_FOLDER}/sra/{SSR_ID}.sra")上述规则给出的错误为
无法从输出文件中确定输入文件中的通配符:
这个问题有什么解决办法吗?当我使用expand时,这也不起作用。
发布于 2020-09-04 16:27:29
问题是,在大括号中指定的所有内容实际上都是通配符。您可能有三个不同的用例,您可以使用花括号:
expand函子在前两种情况下(展开和f-字符串),结果是一个完全指定的字符串,根本没有通配符。如果你有这样的东西:
rule dummy:
input: "{wildcard}.input"
output: expand("{wildcard}.output", wildcard=["1", "2"])其结果很简单:
rule dummy:
input: "{wildcard}.input"
output: ["1.output", "2.output"]如您所见,输出部分中根本没有通配符,因此输入无法确定其通配符的值。
典型的解决方案是将此规则分为两条规则:
rule all:
input: expand("{wildcard}.output", wildcard=["1", "2"])
rule do_some_work:
input: "{wildcard}.input"
output: "{wildcard}.output"但是,请注意,我在{wildcard}中称为rule all:的东西本身并不是通配符,而只是expand函数的本地上下文中任意选择的名称。
https://stackoverflow.com/questions/63724513
复制相似问题