发布于 2020-04-21 14:28:24
从您的描述中,我不能立即明白为什么每个源需要多个hash。任何类型的网络混洗都会限制吞吐量,因此避免所有不必要的混洗对您来说似乎是最好的解决方案。
最终的图片应该如下所示
Source 1 --\
\
Source 2 ----\
+---> Map ---> Sink
... /
/
Source N --/使得每个输入记录仅被重新键入一次。
除了这些一般性的考虑之外,我还需要更多的细节和CEP伪代码来给出更具体的建议。
https://stackoverflow.com/questions/61324012
复制相似问题