我想对批处理数据执行Flink SQL。(S3中的CSV)
但是,我明确希望Flink以流的方式执行我的查询,因为我认为它将比批处理模式更快。
例如,我的查询包括对两个表进行筛选和加入筛选的结果。我希望Flink不要以阻塞批处理的方式实现这两个表,然后通过join传递结果,而是使用流哈希连接操作符,就像datastream中的那样。
我怎样才能做到这一点?我正在使用PyFlink。
发布于 2022-04-04 11:48:49
您可以在https://nightlies.apache.org/flink/flink-docs-master/docs/dev/datastream/execution_mode/上阅读如何为Flink应用程序设置执行模式。结合https://nightlies.apache.org/flink/flink-docs-master/docs/dev/python/python_config/,说明如何在Python应用程序中指定配置选项。
https://stackoverflow.com/questions/71719469
复制相似问题