在Flink文档中的任何地方,我都看到状态是映射函数和工作人员的独立状态。在独立的方法中,这似乎是强大的,但是如果Flink在集群中运行呢?Flink能否处理所有工作人员都可以添加数据并查询数据的全局状态?
摘自Flink关于以下内容的文章:
为了在此设置中实现高吞吐量和低延迟,必须尽量减少任务之间的网络通信。在Flink中,流处理的网络通信只能沿着作业操作图中的逻辑边(垂直)进行,这样就可以将流数据从上游传送到下游运营商。 但是,操作符的并行实例之间没有通信(水平)。为了避免这种网络通信,数据局部性是Flink中的一个关键原则,并强烈影响状态的存储和访问方式。
https://stackoverflow.com/questions/48537986
复制相似问题