首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Flink Hash联接超过最大递归错误数

Flink Hash联接超过最大递归错误数
EN

Stack Overflow用户
提问于 2019-12-10 21:54:13
回答 1查看 272关注 0票数 1

正在发生的事情:在连接flink中的两个数据集时遇到了以下错误:

代码语言:javascript
复制
Hash join exceeded maximum number of recursions, without reducing partitions enough to be memory resident. Probably cause: Too many duplicate keys.

我有两个数据集,一个大的和一个小的,所以我使用了join.Hint as Repartition哈希第二,但我仍然面临同样的问题。

有人能解释一下这一异常的根本原因吗?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-12-16 03:08:38

当"jion“发生在小型和大型数据集中时,可能会发生数据倾斜。会有很多重新规划,我觉得你的问题可能与此有关。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/59275936

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档