在spark中,可以从单个DStream中获得多个DStream。我的用例如下:我从HDFS文件中获取日志数据流。日志行包含一个id (id=xyz)。我需要根据id以不同的方式处理日志行。所以我试着对输入数据流中的每个id使用不同的数据流。我在文档中找不到任何相关的东西。有没有人知道如何在Spark中实现这一点,或者指向任何链接。
谢谢
发布于 2016-01-20 18:45:12
您不能从单个DStreams拆分多个DStreams。你能做的最好的是:-
我总是更喜欢#1,因为它是更干净的解决方案,但也有一些例外,需要实现#2。
https://stackoverflow.com/questions/34897236
复制相似问题