首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >我应该从Kafka ETL中提取技术细节吗?

我应该从Kafka ETL中提取技术细节吗?
EN

Stack Overflow用户
提问于 2017-06-30 21:11:19
回答 1查看 51关注 0票数 0

将ERP (或任何其他可能带有复杂的技术数据模型的“标准软件”)作为源连接到kafka系统的最佳实践是什么?

您是否建议使用源数据库中的视图隐藏这些技术细节?不确定视图是否可以在oracle的JDBC源连接器内“触发”复制。

我能想到的另一种方法是使用它的Stream API在kafka中“连接”所有这些表。这样,源数据库系统就不会被用于执行“ETL连接”。

EN

回答 1

Stack Overflow用户

发布于 2017-07-01 20:34:06

您可以从为ERP软件创建(假设尚不存在) Kafka Connect源连接器开始。在这篇文章中,试着隐藏处理ERP技术细节的复杂性。您还可以执行一些简单的无状态转换,将ERP模型的细节抽象为您的域模型。我的经验告诉我,这是不够的,如果它很复杂,输出仍然会在某种程度上绑定到源模型。请记住以在您的域中有意义的方式对数据进行分区。

接下来,一旦您在kafka中获得了数据并进行了良好的分区,您就可以在Kafka Streams中进行进一步的处理。它们具有容错(使用Kafka v0.11,甚至是事务性的)状态处理功能,并允许轻松地在主题之间进行连接。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/44847341

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档