首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Apache作业中的多流支持

Apache作业中的多流支持
EN

Stack Overflow用户
提问于 2016-11-06 17:35:14
回答 2查看 7.2K关注 0票数 5

我的问题是关于Apache框架。

有没有任何方法来支持一个以上的流媒体源,如卡夫卡和twitter在单一的flink工作?是否有任何工作,around.Can,我们一次处理多个流源,在单个flink作业中?

我目前工作在星火流,这是限制在那里。

通过其他流框架(如Apache、Storm或NIFI )可以实现这一点吗?

人们期待着人们的回应。

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2016-11-07 03:40:00

是的,这在Flink和Storm中是可能的(不知道Samza或NIFI.)

您可以添加任意多个源运算符,并且每个源都可以使用不同的源。

代码语言:javascript
复制
StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();

Properties properties = ... // see Flink webpage for more details    

DataStream<String> stream1 = env.addSource(new FlinkKafkaConsumer08<>("topic", new SimpleStringSchema(), properties);)
DataStream<String> stream2 = env.readTextFile("/tmp/myFile.txt");

DataStream<String> allStreams = stream1.union(stream2);

对于使用低级API的Storm,模式类似。请参阅An Apache Storm bolt receive multiple input tuples from different spout/bolt

票数 8
EN

Stack Overflow用户

发布于 2019-04-05 11:27:26

有些解决方案已经讨论过了,我只想补充一点,在NiFi流中,您可以摄入许多不同的源,并单独或一起处理它们。

还可以摄取一个源,并让多个团队在此基础上构建流程,而无需多次摄入数据。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/40452368

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档