首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >是否可以配置Flink飞行前类型序列化扫描?

是否可以配置Flink飞行前类型序列化扫描?
EN

Stack Overflow用户
提问于 2019-06-04 06:01:29
回答 1查看 56关注 0票数 0

Flink在Flink应用程序(https://ci.apache.org/projects/flink/flink-docs-stable/dev/types_serialization.html)的飞行前阶段执行重要扫描。创建源、运算符和接收器的行为会导致Flink扫描在给定流的拓扑中使用的对象的数据类型,因为很明显,Flink将尝试基于此信息优化作业。

这种扫描是可配置的吗?我可以关闭它,强制Flink只使用Kryo序列化,而不需要或使用任何这些扫描的信息吗?

我在一个专有的库中有一个非常大的,嵌套很深的类,它是自动生成的,当扫描它时,Flink似乎进入了一个非常大的无限循环,在运行几个小时后导致内存不足错误(应用程序实际上从未通过env.execute()启动,即使我显著增加了堆的大小)。这个类有许多循环引用,即类和它的子类包含对相同类型的其他类的引用,这可能是一个问题吗?

EN

回答 1

Stack Overflow用户

发布于 2019-06-04 22:18:54

你可以试一试

代码语言:javascript
复制
env.getConfig().addDefaultKryoSerializer(clazz, serializer)

其中序列化程序是一个custom serializer

您可以通过以下方式强制Kryo

代码语言:javascript
复制
env.getConfig().enableForceKryo();

有关这方面的更多信息,请参阅serialization of pojo types

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/56435068

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档