问如何在Apache正确初始化任务状态？
EN

Stack Overflow用户

提问于 2017-08-18 14:30:08

回答 1查看 929关注 0票数 1

我正在开发基于Apache的金融反欺诈系统。我需要根据金融交易来计算许多不同的总和。我使用Kafka作为流数据源。例如，在平均事务量计算中，我使用MapState存储每张卡的总事务数和总金额。聚集数据存储在Accumulo中。我知道Flink中的持久状态，但这不是我所需要的。在计算开始之前，是否有方法将初始数据加载到Flink中？是否可以使用两个连接的流与Accumulo的数据一起使用最新的计算聚合和事务流？事务流是无限的，由聚合流不是。我该往哪条路挖？任何帮助都是非常感谢的。

我考虑过AsyncIO，但是状态不能与异步函数一起使用。我的想法是:检查内存状态下的聚合。如果这里没有卡的数据-代码调用存储服务，从它获取数据，在内存状态中执行计算和更新，因此，该卡的下一个事务不需要通过调用外部数据服务来处理。但我认为这是个大瓶颈。

apache-flink

java

initialization

回答 1

Stack Overflow用户

发布于 2017-08-19 08:00:22

你可以试试这个方法：

TASK::setInitialState
    TASK::invoke
        create basic utils (config, etc) and load the chain of operators
        setup-operators
        task-specific-init
        initialize-operator-states
        open-operators
        run
        close-operators
        dispose-operators
        task-specific-cleanup
        common-cleanup

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/45759137

复制

相似问题

问如何在Apache正确初始化任务状态？
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何在Apache正确初始化任务状态？EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何在Apache正确初始化任务状态？
EN