首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >流负载均衡

流负载均衡
EN

Stack Overflow用户
提问于 2016-06-09 07:53:51
回答 1查看 132关注 0票数 0

我有两个流。一个是事件流,另一个是数据库更新流。我想用从DB更新流构建的信息来丰富事件流。

事件流非常庞大,并使用5个字段进行划分。这给了我很好的分布。DB流要少得多,并且使用两个字段进行分区。我目前正在使用两个公共字段连接这两个流,并使用flapMap来丰富第一个流。flatMap操作符使用ValueState来维护状态,该状态由两个公共字段自动设置关键字。

我发现事件流中的负载在两个公共字段方面倾向于倾斜。这会导致flapMap实例之间的负载平衡不均衡,少数实例的负载大约是其他实例的10倍。

我认为更好的方法是跨所有flatMap实例广播DB更新流,并根据其现有的分区方案简单地转发事件流。然而,问题是,因为没有为connect操作符指定键,所以我不能使用ValueState。

除了实现自定义逻辑来手动提取键和更新维护状态之外,我还能做什么吗?

有没有我遗漏的更简单的方法?

EN

回答 1

Stack Overflow用户

发布于 2016-06-10 04:28:25

您可以使用CoFlatMapFunction实现Checkpointed接口,以便为广播的DB更新设置检查点,而不是使用键值状态接口。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/37714788

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档