我在一个管道中有多个活动,它们之间存在依赖关系。当我在过去设置我的流水线开始日期时,我的数据切片集没有按时间顺序执行。详述:
假设我有两个活动A1 & A2。A2依赖于A1,执行时间比A1长得多。假设我今天上传我的管道,开始日期是3天前(d-3)。我希望我的活动遵循如下顺序:
A1(d-3) -> A2(d-3) -> A1(d-2) -> A2(d-2) -> A1(d-1) -> A2(d-1) ->
但在实践中,我看到A1的所有数据片都已执行,而A2(d-3)仍在执行中。如何强制特定日期的所有数据切片在第二天的切片被占用之前完成?
发布于 2018-03-19 20:17:03
我认为没有办法做到这一点,因为每个数据切片都是独立于其他数据切片的,不应该依赖于以前的执行。如果您让查询正确,那么执行顺序应该无关紧要。
https://stackoverflow.com/questions/49360676
复制相似问题