问是否可以配置Flink飞行前类型序列化扫描？
EN

Stack Overflow用户

提问于 2019-06-04 06:01:29

回答 1查看 56关注 0票数 0

Flink在Flink应用程序(https://ci.apache.org/projects/flink/flink-docs-stable/dev/types_serialization.html)的飞行前阶段执行重要扫描。创建源、运算符和接收器的行为会导致Flink扫描在给定流的拓扑中使用的对象的数据类型，因为很明显，Flink将尝试基于此信息优化作业。

这种扫描是可配置的吗？我可以关闭它，强制Flink只使用Kryo序列化，而不需要或使用任何这些扫描的信息吗？

我在一个专有的库中有一个非常大的，嵌套很深的类，它是自动生成的，当扫描它时，Flink似乎进入了一个非常大的无限循环，在运行几个小时后导致内存不足错误(应用程序实际上从未通过env.execute()启动，即使我显著增加了堆的大小)。这个类有许多循环引用，即类和它的子类包含对相同类型的其他类的引用，这可能是一个问题吗？

flink-streaming

apache-flink

回答 1

Stack Overflow用户

发布于 2019-06-04 22:18:54

你可以试一试

env.getConfig().addDefaultKryoSerializer(clazz, serializer)

其中序列化程序是一个custom serializer。

您可以通过以下方式强制Kryo

env.getConfig().enableForceKryo();

有关这方面的更多信息，请参阅serialization of pojo types。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/56435068

复制

相似问题

问是否可以配置Flink飞行前类型序列化扫描？
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问是否可以配置Flink飞行前类型序列化扫描？EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问是否可以配置Flink飞行前类型序列化扫描？
EN