我们知道Flink是一个真正的实时流处理引擎,它可以在记录到达时处理记录,我们也知道火花流是一个微批量流处理引擎。
然而,我们也知道星星之火发布了结构化的流媒体,它怎么样?它是否也是一个真正的实时流处理引擎,就像Flink一样,它可以在记录到达时立即处理记录,而不是微批处理,或者仍然使用微批处理模式?
发布于 2017-06-29 03:44:19
结构化流是实时流处理引擎吗?
TL;博士No.或者是的。取决于“实时流处理引擎”的定义。
到目前的2.3.0-SNAPSHOT (当前的主控),结构化流媒体使用的是微批,似乎没有任何迹象表明它在未来的版本中会有所不同。
深入研究结构化流的流查询引擎
StreamExecution (流查询的执行环境) 启动单独的执行线程。,用于检查新记录是否可用。
一旦启动,microBatchThread (它是一个常规的java.lang.Thread对象)执行runBatches那个开始执行每个触发间隔。。
通过代码,可以发现所做的流查询的内部执行引擎,对每个触发器进行批处理。
我的理解是,就微配料而言,没有什么真正的改变。它在星火流中是这样的,在结构化流中也是如此。
无耻的插头:你可能想探索更多的细节,阅读我的关于结构化流媒体的手册,这正是我写的目的,以了解非常低层次的细节。欢迎评论。
https://stackoverflow.com/questions/44771691
复制相似问题