首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何动态序列化flink streaming中的参数

如何动态序列化flink streaming中的参数
EN

Stack Overflow用户
提问于 2020-06-30 11:19:18
回答 1查看 35关注 0票数 0

我有一个在flink流中序列化的参数params

代码语言:javascript
复制
class P extend Serializable {...}

val params = new P(...)
val env = StreamExecutionEnvironment.getExecutionEnvironment
env.addSource(new MySource(params))
   .map(new MyMap(params))
   .addSink(new MySink(params))
env.setParallelism(1)
env.execute("My Job")

但是驱动节点中的参数会发生变化,我需要在作业运行期间将params更新为executor。有没有可能基于flink流作业不停顿?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-07-02 18:01:56

简而言之,答案是否定的。因为您的UDF将需要在每次新记录到来时反序列化参数,这将减慢执行速度。

但是,您可以通过扩展AbstractUdfStreamOperator并在transform operation中调用它来实现自己的流运算符。我在这里做了一个例子:"Implementing my own stream operator in Flink to deal with data skew“。

然后决定何时读取新参数的运算符。例如,只需创建一个调度为每10分钟线程。参数文件必须放置在操作员将要运行的所有节点上。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/62649765

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档