首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何在Apache Flink中有条件地处理流数据

如何在Apache Flink中有条件地处理流数据
EN

Stack Overflow用户
提问于 2020-07-22 15:41:42
回答 1查看 155关注 0票数 0

我正在使用Flink来开发我的Java流媒体工作。

在我的例子中,有两个数据源:A和B。

A保持生成布尔数据: true或false。

我正在努力实现这样一个目标:

代码语言:javascript
复制
if get false from A
    get data from B and do some process
else
    do nothing

我如何编写我的流媒体作业?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-07-23 00:46:12

Flink适用于push模型,而不是pull模型。因此,您并不是“从B获取数据”,而是每当数据从B到达时都会调用您的操作符。假设您对数据源A使用广播流,那么您可以忽略(丢弃)来自B的数据,或者在获得true时对其进行缓冲和处理(但缓冲状态可能具有挑战性,这取决于您在等待来自A的真实信号时可能收到的数据量)。

请注意,如果B是某个队列系统(例如Kafka),那么您可以将其建模为来自A的简单的单输入运算符,其中您的运算符直接使用Kafka消费者从Kafka主题中提取数据。显然还有更多的工作要做,但这是一个可能的解决方案。您可能希望保存当前的偏移状态(类似于Flink Kafka源代码)。运算符的并行度与Kafka中的分区数量之间存在额外的复杂性,等等。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/63029198

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档