文章/答案/技术大牛

发布

社区首页 >问答首页 >Kafka流的最佳实践

问Kafka流的最佳实践
EN

Stack Overflow用户

提问于 2018-08-20 03:03:37

回答 1查看 652关注 0票数 4

我们有一个用python编写的预测服务来提供机器学习服务，您可以发送它一组数据，它会给出异常检测或预测等等。

我想使用Kafka流来处理实时数据。

有两种选择方法：

卡夫卡流作业只完成ETL函数:加载数据，并进行简单的转换和保存数据到弹性搜索。然后启动定时器，周期性地从ES加载数据，并调用预测服务来计算结果并将结果保存回ES。
卡夫卡流作业除了ETL之外，所有的事情都是由卡夫卡流作业完成ETL，然后发送数据预测服务，并将计算结果保存给卡夫卡，消费者将结果从卡夫卡转发到ES。

我认为第二种方法是更实时的，但我不知道在流作业中做这么多的预测任务是个好主意。

对于这种应用，是否有任何共同的模式或建议？

machine-learning

apache-kafka

etl

apache-kafka-streams

回答 1

Stack Overflow用户

发布于 2018-08-20 09:56:08

是的，我也会选择第二种选择。

您可以做的是使用Kafka作为您的ML培训模块和您的预测模块之间的数据管道。这些模块可以在Kafka流中很好地实现。

请看下面的图表：

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/51923672

复制

相似问题

问Kafka流的最佳实践
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Kafka流的最佳实践EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Kafka流的最佳实践
EN