我是Flink流媒体的初学者。我正在处理大约每秒5000个传入的事件,需要查找过去3天的事件窗口。我的问题是: Flink在哪里存储它的窗口数据?我会受到RAM大小的限制吗?在每秒5000字节和每个事件2000字节的情况下,我正在考虑三天窗口的非常大的存储需求。
发布于 2018-03-13 04:42:49
Flink提供了相当多的选项来存储临时的"3天窗口数据“(通常称为”窗口状态“)。默认情况下,它存储在内存中(受JobManager内存的限制),但正如您所提到的,它可以根据窗口的大小快速增长。因此,Flink支持将状态的副本(快照)保存到磁盘,这一过程称为检查点。要实现这一点,您应该配置一个状态后端,例如RocksDB。
关于这个的更多信息:
1
2
3
https://stackoverflow.com/questions/49241901
相似问题