首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何处理FLINK中的超大窗口?

如何处理FLINK中的超大窗口?
EN

Stack Overflow用户
提问于 2017-11-09 16:13:22
回答 2查看 624关注 0票数 0

现在我有一个要求,汇总某人在过去3个月的操作。然后将结果放入ML模型中,得到异常。

考虑到系统的巨大流量,这是一个非常大的窗口。

我该如何处理这种情况?

EN

回答 2

Stack Overflow用户

发布于 2017-11-10 18:29:23

我将基于以下假设回答您的问题:数据是以流的方式到来的,您需要在该流的顶部创建一个窗口,因为您的问题中没有明确的详细信息。

话虽如此,您可以使用RocksDB状态后端创建如此巨大的窗口,因为该窗口不会存储在内存中,并且您的窗口大小限制将仅取决于硬件的硬盘大小。

票数 1
EN

Stack Overflow用户

发布于 2017-11-10 12:09:07

你可以对Flink使用批处理,因为你有一个数据集,然而,flink是一个真正的流引擎,这意味着批处理被认为是流的特例。另一种选择是使用Hadoop进行这种批处理。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/47196904

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档