我知道当我们运行一个以两个通道为输入的进程时,我们必须使用collect(),其中第一个通道有一个元素,然后第二个通道有>1个元素:
#! /usr/bin/env nextflow
nextflow.enable.dsl=2
process A {
input:
val(input1)
output:
path 'index.txt', emit: foo
script:
"""
echo 'This is an index' > index.txt
"""
}
process B {
input:
val(input1)
path(input2)
output:
path("${input1}.txt")
script:
"""
cat <(echo ${input1}) ${input2} > \"${input1}.txt\"
"""
}
workflow {
A( Channel.from( 'A' ) )
// This would only run for one element of the first channel:
B( Channel.from( 1, 2, 3 ), A.out.foo )
// and this for all of them as intended:
B( Channel.from( 1, 2, 3 ), A.out.foo.collect() )
}现在的问题是:为什么在不使用collect()或toList()的情况下,来自nextflow-io (https://github.com/nextflow-io/rnaseq-nf/blob/master/modules/rnaseq.nf#L15)的示例工作流中的这一行可以工作
同样的情况,具有一个元素(索引)的通道和具有>1的通道( fastq对)将由相同的进程(定量)使用,并且它在所有fastq文件上运行。与我的虚拟示例相比,我遗漏了什么?
发布于 2021-06-26 04:04:10
您需要使用value工厂创建第一个通道,该工厂永远不会耗尽通道。
您的链接示例implicitly creates a value channel,这就是它工作的原因。在A.out.foo上调用.collect()时也会发生同样的情况。
Channel.from (或更现代的Channel.of)创建了一个可能会耗尽的序列通道,这就是为什么A和B都只运行一次。
所以
A( Channel.value('A') )就是你所需要的。
https://stackoverflow.com/questions/68134271
复制相似问题