我的输入是EventHub流,输出是服务总线队列。
我的查询使用TUMBLINGWINDOW聚合事件,以便从流输出到队列。
如果我必须暂停流分析,并在它停止后继续运行,这是否意味着我的数据窗口现在将被延迟?或者它会赶上上次停止日期到现在第一个窗口之间的事件?
E.G. --我停止分析一个小时,从停止点开始继续分析,所以从现在开始,它总是在一小时后处理新的事件。
或
我停止分析一个小时,从停止点继续,第一个输出将包含数据从一个小时前到现在,新窗口将实时处理新的数据。
发布于 2016-09-12 14:08:58
由于Stream将继续从它停止运行的地方读取数据,它将直接摄入所有它能够立即获取的数据,并且在它完成暂停后的所有数据之后,几乎立即开始生成实时数据。
发布于 2017-10-06 08:24:13
当我创建工作时,我也在想同样的事情。当您第一次启动作业时,只有两个选项可用于“作业输出启动时间”、“现在”和“自定义”。
但是,当您在第一次之后启动作业时,您将得到另一个选项:何时最后停止。

若要在不丢失数据的情况下恢复已停止的作业,请选择“最后停止”(请注意,如果首次运行作业,则此选项不可用)。
https://stackoverflow.com/questions/39452231
复制相似问题