我有一个云数据流管道,如下所示:
最初没有设置任何最大的work和num,它可以很好地工作,但是需要很长时间来处理大型数据集,然后我指定了一些maxNumWorkers,比如60和numWorkers为6,这很好,但是我们在处理结束时丢失了很多数据
我们也试过这个
-自动标度算法=基于吞吐量的--max_num_workers=5
仍然工作从一个工人开始,并且不会自动缩放。
然而,数据流工人似乎并不是在自动旋转和平衡负载。
发布于 2020-07-27 09:35:03
https://stackoverflow.com/questions/63108479
复制相似问题